核酸序列

核酸序列（英語：Nucleic acid sequence）是指核酸結構中的含氮鹼基，共有四種，分別為A（腺嘌呤）、T（胸腺嘧啶）、C（胞嘧啶）、G（鳥糞嘌呤），並且有無窮盡的線性排列組合來表達基因，而各個基因都具有獨特的鹼基序列^[1]^{[查證請求]}。兩個鹼基形成一個鹼基對，鹼基對的配對規律是固定的，即A配對T，C配對G。三個相鄰的鹼基對形成一個密碼子。一種密碼子對應一種胺基酸，不同的胺基酸合成不同的蛋白質。在DNA的複製及蛋白質的合成過程中，鹼基配對規律是十分關鍵的。

DNA的字母排列有A、C、G、T，(RNA則為A、U、C、G，詳見RNA)。鹼基對會無間隔的排列在一起，例如序列AAAGTCTGAC。任意長度大於4的一串核苷酸被稱作一個序列。關於它的生物功能，則依賴於上下文的序列，一個序列可能被正讀，反讀；包含編碼或者無編碼。DNA序列也可能包含非編碼DNA。

核酸也具有二級結構和三級結構。一級結構有時被錯誤地稱為一級序列。相反，沒有並行的二級或三級序列概念。

核苷酸

RNA的化學結構

部分mRNA分子中的一系列密碼子。每個密碼子由三個核苷酸組成，通常代表單個胺基酸。

核酸由稱為核苷酸的連接單位的長鏈組成。每個核苷酸由三個亞基組成：磷酸基團和糖（在RNA的情況下是核糖，而在DNA中的脫氧核糖）構成核酸鏈的骨架，並且與糖連接是一組核鹼基之一。核鹼基在鏈的鹼基對中是重要的，以形成更高級的二級結構和三級結構，例如著名的雙螺旋。

可能的字母是A，C，G和T，代表DNA鏈的四個核苷酸鹼基 - 腺嘌呤，胞嘧啶，鳥嘌呤，胸腺嘧啶 - 與磷酸二酯骨架共價連接。在典型情況下，序列無間隙地相互鄰接被印刷，如AAAGTCTGAC序列中從5'到3'方向從左到右讀。關於轉錄，如果序列與轉錄的RNA具有相同的順序，則序列位於編碼鏈上。

一個序列可以與另一個序列互補性(分子生物學)（英語：Complementarity (molecular biology)），這意味著它們在互補的每個位置上具有鹼基（即A至T，C至G）並且以相反的順序。例如，TTAC的互補序列是GTAA。如果雙鏈DNA的一條鏈被認為是有義鏈（sense strand），那麼被認為是反義鏈的另一條鏈將具有與有義鏈的互補序列。

符號

比較和確定兩個核苷酸序列之間的％差異。

AATCCGCTAG
AAACCCTTAG
給定兩個10個核苷酸的序列，將它們排成一行並比較它們之間的差異。通過將不同DNA鹼基的數量除以核苷酸的總數來計算相似性百分比。在上述情況下，10個核苷酸序列存在三個差異。因此，將7/10除以得到70％的相似度，並從100％減去得到30％的差異。

雖然A，T，C和G代表某個位置的特定核苷酸，但也有代表模糊性的字母，當在該位置可能出現一種以上的核苷酸時使用這些字母。國際純粹與應用化學聯合會（IUPAC）的規則如下^[2]：

符號^[3]	描述	被表現鹼基					互補鹼基
A	腺嘌呤	A				1	T
C	胞嘧啶		C				G
G	鳥嘌呤			G			C
T	胸腺嘧啶				T		A
U	尿嘧啶				U		A
W	Weak	A			T	2	W
S	Strong		C	G			S
M	胺	A	C				K
K	酮			G	T		M
R	嘌呤	A		G			Y
Y	嘧啶		C		T		R
B	除A外 (B comes after A)		C	G	T	3	V
D	除C外 (D comes after C)	A		G	T		H
H	除G外 (H comes after G)	A	C		T		D
V	除T外 (V comes after T and U)	A	C	G			B
N	任何 Nucleotide (not a gap)	A	C	G	T	4	N
Z	0					0	Z

這些符號對RNA也有效，除了用U（尿嘧啶）代替T（胸腺嘧啶）^[2]。

除了腺嘌呤（A），胞嘧啶（C），鳥嘌呤（G），胸腺嘧啶（T）和尿嘧啶（U）之外，DNA和RNA還含有在核酸鏈形成後已被修飾的鹼基。在DNA中，最常見的修飾鹼是5-甲基胞苷（m5C）。在RNA中，有許多修飾的鹼基，包括假尿苷（Ψ），二氫尿苷（D），肌苷（I），核糖胸苷（rT）和7-甲基鳥苷（m7G）^[4]^[5]。次黃嘌呤和黃嘌呤是通過誘變劑存在產生的許多鹼中的兩種，它們都通過脫氨作用（用羰基取代胺基）。次黃嘌呤是由腺嘌呤產生的，而黃嘌呤是由鳥嘌呤產生的^[6] 。類似地，胞嘧啶的脫氨基作用導致尿嘧啶。

生物學意義

遺傳密碼的一個描述，通過該遺傳密碼將核酸中包含的信息翻譯成蛋白質中的胺基酸序列。

在生物系統中，核酸含有活細胞用於構建特定蛋白質的信息。核酸鏈上的核鹼基序列通過細胞機器翻譯成構成蛋白質鏈的胺基酸序列。被稱為一個密碼子(codon)的每組三個鹼基對應於單個胺基酸，並且存在特定的遺傳密碼，通過該遺傳密碼，三個鹼基的每種可能組合對應於特定胺基酸。

分子生物學的中心法則概述了使用核酸中包含的信息構建蛋白質的機制。 DNA被轉錄成mRNA分子，其進入核糖體，其中mRNA用作構建蛋白質鏈的模板。由於核酸可以與具有互補序列的分子結合，因此在編碼蛋白質的「有義」序列和本身無功能但可以與有義鏈結合的互補「反義」序列之間存在區別。

參見

參考文獻

^ Neil A.Campbell. Biology： A Global Approach, Global Edition. U.S.: Pearson. 2018. ISBN 978-1292170435.
^ ^2.0 ^2.1 Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences （頁面存檔備份，存於網際網路檔案館）, NC-IUB, 1984.
^ Nomenclature Committee of the International Union of Biochemistry (NC-IUB). Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences. 1984 [2008-02-04]. （原始內容存檔於2017-08-21）.
^ BIOL2060: Translation. mun.ca. [2018-12-26]. （原始內容存檔於2020-08-05）.
^ Research. uw.edu.pl. [2018-12-26]. （原始內容存檔於2017-09-12）.
^ Nguyen, T; Brunson, D; Crespi, C L; Penman, B W; Wishnok, J S; Tannenbaum, S R. DNA damage and mutation in human cells exposed to nitric oxide in vitro. Proc Natl Acad Sci U S A. April 1992, 89 (7): 3030–3034. PMC 48797  . PMID 1557408. doi:10.1073/pnas.89.7.3030.

[1] Neil A.Campbell. Biology： A Global Approach, Global Edition. U.S.: Pearson. 2018. ISBN 978-1292170435.

[NCIUB-2] 2.0 ^2.1 Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences （頁面存檔備份，存於網際網路檔案館）, NC-IUB, 1984.

[iupac-3] Nomenclature Committee of the International Union of Biochemistry (NC-IUB). Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences. 1984 [2008-02-04]. （原始內容存檔於2017-08-21）.

[4] BIOL2060: Translation. mun.ca. [2018-12-26]. （原始內容存檔於2020-08-05）.

[5] Research. uw.edu.pl. [2018-12-26]. （原始內容存檔於2017-09-12）.

[6] Nguyen, T; Brunson, D; Crespi, C L; Penman, B W; Wishnok, J S; Tannenbaum, S R. DNA damage and mutation in human cells exposed to nitric oxide in vitro. Proc Natl Acad Sci U S A. April 1992, 89 (7): 3030–3034. PMC 48797  . PMID 1557408. doi:10.1073/pnas.89.7.3030.

[1]

[2]

[3]

[4]

[5]

[6]