在一棵樹中可以指定靠近根的那個節點叫做另一個節點的父節點(也叫父親、雙親、。。。。
叫孩子,兒子,子女等……父親方向的所有節點都叫做這個節點的祖先,,兒子方向的所有節點都叫做這個節點的子孫。沒有子節點的子節點叫做葉節點(或者葉子節點)。由於到根的路徑隻有一條,根節點以外的節點的父節點永遠隻有一個,祖先就是這個點到根的路徑上的所有節點(包括根,不包括這個節點本身)。另外,以一個節點為根的樹是指包括這個節點和其所有子孫,並以這個節點為根的樹。由於一般不需要這以外的子樹,每一個節點也可以對應到一個以其為根的樹,一個節點的子樹通常也是指以這個節點的子節點為根的樹。
如果一顆有根樹每個節點的子樹最多有n個,同時每個節點在其父節點中都有固定的可能可以留空的位置,這棵樹叫做n叉樹。其中每個節點都可以有兩個固定位置的子樹的有根樹叫做二叉樹,二叉樹中每個節點的兩個子樹分彆叫做左子樹和右子樹,由於位置固定,沒有左子樹的時候也是可以有右子樹的。而“多叉樹”通常並不指n為任意值的n叉樹,隻是在和n叉樹作比較的時候表示普通的有根樹。
對於隨機的樹,高度的平均複雜度是O(logn,但是沒有限製而且不隨機的樹高度也可以達到O(n,也就是除了葉節點都隻有一個子樹,或者常數個分支的情況。所以樹作為數據結構時通常需要另外進行平衡。
存儲
對於普通的樹,可以像圖一樣為每一個點存儲一個邊表(通常按順序存和每一個點的關係的叫做鄰接矩陣,存具體的邊的叫做鄰接表),或者直接存儲所有邊的邊表等。由於樹是稀疏圖,所以一般不用鄰接矩陣存儲。對於有根樹,如果用為每一個點儲存一個邊表的方法,由於每一棵樹都隻有一個父節點,所以通常指向父節點的邊不存在這個表中。同時如果子節點是沒有順序的,也是因為一個節點的子節點不會同時是其他節點的子節點,也可以把子節點直接當成存邊的鏈表的節點,這時候每個節點隻需要儲存兩個指針,所以這種存儲方法有時候也會被叫做多叉樹轉二叉樹。
對於子節點是有順序的有根樹,每條邊都可以以固定的位置分彆儲存。對於完全二叉樹甚至能直接用一個數組訪問所有節點,不另外儲存邊的信息。有的樹可以被設計成固定的從根節點開始訪問,這時候可以不儲存父節點。同樣的,有的樹也可以省略子節點,例如並查集。
樹的遍曆
對於一般的樹,可以用和普通的圖一樣的方法遍曆,比如深度優先搜索和寬度優先搜索。如果和樹的每個節點相鄰的點有固定的順序,深度優先搜索可以不儲存當前點以外的任何信息,而且不用判重。而在有根樹中更方便,所以有根樹中很少使用寬度優先搜索。
對於有根樹的從根開始的深度優先搜索遍曆,有三種特定的順序:
前序遍曆
先訪問根節點,然後再訪問所有的子樹;
後序遍曆
先訪問子樹,然後再訪問根節點;
中序遍曆
二叉樹專用,先訪問左子樹,然後是根節點,最後是右子樹。
注意對於每一種遍曆,事實上都得先訪問根節點,這裡的遍曆順序是指處理節點中的數據的順序。已知中序遍曆和任一其他遍曆的情況下,可以還原一個二叉樹。一個直觀的方法是按前序或者反轉的後序插入一個按中序排序的搜索樹。已知前序和中序也可以還原一棵樹,但是不能知道二叉樹中一個節點唯一的子樹是在左邊還是右邊。
事實上也可以把左右的順序反過來。這些由根開始的遍曆方法也適用於特定的一個子樹。
森林