raw_scoremat.c
上传用户:yhdzpy8989
上传日期:2007-06-13
资源大小:13604k
文件大小:4k
源码类别:

生物技术

开发平台:

C/C++

  1. /*
  2.  * ===========================================================================
  3.  * PRODUCTION $Log: raw_scoremat.c,v $
  4.  * PRODUCTION Revision 1000.1  2004/02/12 22:02:35  gouriano
  5.  * PRODUCTION PRODUCTION: UPGRADED [CORE_001] Dev-tree R1.3
  6.  * PRODUCTION
  7.  * ===========================================================================
  8.  */
  9. /*  $Id: raw_scoremat.c,v 1000.1 2004/02/12 22:02:35 gouriano Exp $
  10.  * ===========================================================================
  11.  *
  12.  *                            PUBLIC DOMAIN NOTICE
  13.  *               National Center for Biotechnology Information
  14.  *
  15.  *  This software/database is a "United States Government Work" under the
  16.  *  terms of the United States Copyright Act.  It was written as part of
  17.  *  the author's official duties as a United States Government employee and
  18.  *  thus cannot be copyrighted.  This software/database is freely available
  19.  *  to the public for use. The National Library of Medicine and the U.S.
  20.  *  Government have not placed any restriction on its use or reproduction.
  21.  *
  22.  *  Although all reasonable efforts have been taken to ensure the accuracy
  23.  *  and reliability of the software and data, the NLM and the U.S.
  24.  *  Government do not and cannot warrant the performance or results that
  25.  *  may be obtained by using this software or data. The NLM and the U.S.
  26.  *  Government disclaim all warranties, express or implied, including
  27.  *  warranties of performance, merchantability or fitness for any particular
  28.  *  purpose.
  29.  *
  30.  *  Please cite the author in any work or product based on this material.
  31.  *
  32.  * ===========================================================================
  33.  *
  34.  * Author:  Aaron Ucko
  35.  *
  36.  * File Description:
  37.  *   Protein alignment score matrices; shared between the two toolkits.
  38.  *
  39.  */
  40. #include <util/tables/raw_scoremat.h>
  41. #include <ctype.h>
  42. #include <string.h>
  43. #include "sm_blosum45.c"
  44. #include "sm_blosum62.c"
  45. #include "sm_blosum80.c"
  46. #include "sm_pam30.c"
  47. #include "sm_pam70.c"
  48. #include "sm_pam250.c"
  49. static const char kNCBIstdaa[] = "-ABCDEFGHIKLMNPQRSTVWXYZU*";
  50. int NCBISM_GetIndex(const SNCBIPackedScoreMatrix* sm, int aa)
  51. {
  52.     const char *p;
  53.     /* Translate to NCBIeaa */
  54.     if (aa >= 0  &&  aa < sizeof(kNCBIstdaa)) {
  55.         aa = kNCBIstdaa[aa];
  56.     } else if (islower(aa)) {
  57.         aa = toupper(aa);
  58.     }
  59.     p = strchr(sm->symbols, aa);
  60.     return p ? p - sm->symbols : -1;
  61. }
  62. TNCBIScore NCBISM_GetScore(const SNCBIPackedScoreMatrix* sm,
  63.                            int aa1, int aa2)
  64. {
  65.     int i1, i2;
  66.     i1 = NCBISM_GetIndex(sm, aa1);
  67.     i2 = NCBISM_GetIndex(sm, aa2);
  68.     if (i1 >=0  &&  i2 >= 0) {
  69.         return sm->scores[i1 * strlen(sm->symbols) + i2];
  70.     } else {
  71.         return sm->defscore;
  72.     }
  73. }
  74. void NCBISM_Unpack(const SNCBIPackedScoreMatrix* psm,
  75.                    SNCBIFullScoreMatrix* fsm)
  76. {
  77.     const char* sym;
  78.     int         dim, i, j, aa1, aa2;
  79.     sym = psm->symbols;
  80.     dim = strlen(sym);
  81.     /* fill with default */
  82.     memset(&fsm->s, psm->defscore, NCBI_FSM_DIM * NCBI_FSM_DIM);
  83.     for (i = 0;  i < dim;  ++i) {
  84.         aa1 = sym[i];
  85.         /* get core (NCBIeaa x NCBIeaa) */
  86.         for (j = 0;  j < dim;  ++j) {
  87.             aa2 = sym[j];
  88.             fsm->s[aa1][aa2] = psm->scores[i * dim + j];
  89.         }
  90.         /* extend horizontally */
  91.         for (aa2 = 0;  aa2 < sizeof(kNCBIstdaa);  ++aa2) {
  92.             fsm->s[aa1][aa2] = fsm->s[aa1][(int)kNCBIstdaa[aa2]];
  93.         }
  94.         for (aa2 = 'a';  aa2 <= 'z';  ++aa2) {
  95.             fsm->s[aa1][aa2] = fsm->s[aa1][toupper(aa2)];
  96.         }
  97.     }
  98.     /* extend vertically */
  99.     for (aa1 = 0;  aa1 < sizeof(kNCBIstdaa);  ++aa1) {
  100.         memcpy(fsm->s[aa1], fsm->s[(int)kNCBIstdaa[aa1]], NCBI_FSM_DIM);
  101.     }
  102.     for (aa1 = 'a';  aa1 <= 'z';  ++aa1) {
  103.         memcpy(fsm->s[aa1], fsm->s[toupper(aa1)], NCBI_FSM_DIM);
  104.     }
  105. }
  106. /*
  107.  * ===========================================================================
  108.  * $Log: raw_scoremat.c,v $
  109.  * Revision 1000.1  2004/02/12 22:02:35  gouriano
  110.  * PRODUCTION: UPGRADED [CORE_001] Dev-tree R1.3
  111.  *
  112.  * Revision 1.3  2003/12/29 21:25:50  ucko
  113.  * +PAM250
  114.  *
  115.  * Revision 1.2  2003/10/02 15:37:34  ivanov
  116.  * Get rid of compilation warnings
  117.  *
  118.  * Revision 1.1  2003/08/21 19:48:20  ucko
  119.  * Add tables library (shared with C) for raw score matrices, etc.
  120.  *
  121.  * ===========================================================================
  122.  */