מבוא לביואינפורמטיקה – חלק ב

שלום לכם,

בפוסט לפנינו: נבין את החשיבות של העמדת רצפים, נלמד להכיר איך נראית העמדת רצפים ונלמד מהם העמדה מקומית והעמדה גלובלית.

העמדת רצפים

להלן רצף של DNA:

והנה רצף של חלבון:

כאשר אנחנו מתבוננים ברצף כלשהוא, זה יכול להיות רצף של DNA ,RNA או של חלבון, הדבר הראשון שאנחנו רוצים לעשות איתו בדרך כלל הוא להשוות אותו לרצפים אחרים. השוואת הרצפים הזו טמונה בלב האנליזה של הביואינפורמטיקה והכרחית על מנת לקבוע את המבנה או הפונקציונאליות של הרצפים.

ככל שתהליך הריצוף נהיה נפוץ יותר וקל יותר לשימוש ובאופן הזה מייצר יותר דאטא, השוואת רצפים נהיית יותר ויותר חשובה להבנת הפונקציונאליות או הסקת ההשתייכות האבולוציונית של דוגמת חלבון או DNA חדשה, בהשוואה למסד נתונים קיים.

במילים אחרות, ככל שהטכנולוגיה מתקדמת יותר,נוצרים כלים חדשים שיוצרים שאלות חדשות, שבתורם דוחקים את החוקרים לייצר טכנולוגיות חדישות וחוזר חלילה.

התהליך היסודי ביותר עבור השוואות רצפים הינו העמדת רצפים (sequence alignment). או במילים אחרות אנחנו משווים רצפים על ידי העמדת רצפים.

אז מהי בעצם העמדת רצפים?

בתהליך העמדת רצפים נעשה חיפוש של מאפיינים או דפוסים דומים. הרצפים מועמדים באופן שכל יחידה ברצף תמצא במיקום האידיאלי יחסית לבן הזוג שלה ברצף השני או לקבוצת הרצפים.

התהליך נקרא: Pair-wise Sequence Alignment (העמדת זוג רצפים)  או Multiple Sequence Alignment (העמדת רצפים מרובים)

המטרה הכללית של העמדת זוג רצפים היא למצוא את הַעֲמָדָה הכי טובה כך שתהיה התאמה מקסימאלית בין הרצפים. על מנת להשיג מטרה זו, אחד הרצפים צריך לזוז ביחס לרצף השני באופן שיביא להתאמה המקסימלית.

באופן מוחשי יותר, שני הרצפים מועמדים בשתי שורות זה מול זה.

בדיאגרמה מוצגים רצפים של חלבון המועמדים זה מול זה

אותיות זהות או דומות יהיו ממוקמות על אותו טור, בעוד שאותיות שאינן זהות או דומות ימוקמו באותו טור, או כ"שידוך" לא מוצלח, או כמחדר (gap) ברצף הנגדי.

במקרה של העמדה אופטימאלית, אותיות שאינן זהות ומחדרים, ממוקמים בצורה שבה נקבל את מירב ההתאמות האפשריות.

בדיאגרמה מוצגים רצפים של חלבון המועמדים זה מול זה באופן האופטימלי.

ניתן לראות שישנה התאמה כמעט מלאה בין שני הרצפים אך היא לא מושלמת. במקרים בהם אין התאמה נאלץ להוסיף מחדר או "לשדך" בצורה לא מוצלחת.

כדי להבין יותר לעומק, כדאי לדעת שישנם שתי אסטרטגיות להעמדת רצפים: העמדה גלובלית, והעמדה לוקאלית (מקומית).

בהעמדה גלובלית, נעשה נסיון להעמיד את כל הרצף על ידי שימוש של כל היחידות הנתונות מתחילה ועד סוף הרצפים. רצפים הדומים האחד לשני ובערך באותו אורך מתאימים לסוג הזה של העמדה, אולם עבור רצפים משתנים, או בעלי אורכים שונים, שיטה זו כנראה שלא תצליח לייצר תוצאה אופטימלית, מכוון שהיא תתקשה בזיהוי האזורים המוגבלים בהם ישנו דמיון.

העמדה מקומית לעומת זאת, מתעלמת מהעובדה שישנה אפשרות לדמיון מעבר למה שנתון לה ברגע נתון ולכן העמדה יותר מדויקת (אך כמובן מקומית).
בשיטה זו מתאפשרת העמדת רצפים לטובת דפוסים שמורים בעיקר ברצפים מפוצלים ושני הרצפים יכולים להיות באורכים שונים.
באופן עקרוני, שני סוגי האלגוריתמים המקומי והגלובאלי מאד דומים. מה ששונה היא האסטרטגיה או הגישה בהעמדת הרצפים.

ישנם שלוש שיטות עיקריות להעמדת רצפים:

  1. שיטת מטריצה הנקודה  Dot Matrix Method.
  2. שיטת הטבלה הדינאמית  Dynamic Programmin Method
  3. שיטת Word Method (אם יש לכם תרגום מסודר נשמח לשמוע).

על השיטות מטריצת נקודות וטבלה דינאמית נדבר בפוסטים הבאים.

אם יש לכם הערות, הארות, שאלות, פידבקים על התוכן או על איך שהאתר נראה, רעיונות אתם יותר ממוזמנים ליצור קשר⛓️:bioinformatics.israel@gmail.com


Facebook

השאר תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *