搜狗細胞詞庫采用scel格式,用Unicode編碼漢字和拼音。整個scel格式的內容有:表頭信息、詞庫介紹、拼音組合列表、詞條列表。scel格式的詞條數據結構還是設計的很好的。它使用拼音指針來避免條目中重復的拼音占用內容,它還結合了同音字來節省空間。
QQ分類詞庫采用qpyd格式,原本使用zip壓縮詞條列表。qpyd格式的內容有:標題信息、詞庫介紹、壓縮詞條列表。因為qpyd格式使用zip壓縮,所以在條目數量相同的情況下,整個文件看起來會比其他格式的同義詞庫小。然而,與搜狗的scel格式不同,在qpyd格式中,每個條目都與其拼音相對應。單詞用UTF8編碼,但拼音用Unicode編碼。