是同一對父母生的,為什麼哥哥有家族遺傳病史,我卻沒有?這個祕密可能就在於每個人不同的23對染色體上。
每條染色體均由無數個稱為鹼基的化學分子依序串連而成,組成鹼基對的單位結構只有4種:腺嘌呤(adenine, A)、胸腺嘧啶(thymine, T)、胞嘧啶(cytosine, C)以及鳥嘌呤(guanine, G),而透過「基因定序」,將DNA長鏈上所有ATCG的組成順序解構出來,也就是說將基因體完全解碼後,就能一窺人類染色體的奧秘。由於人類基因體過於龐大複雜,解碼後的基因數據需要藉由專家進一步分析,才能針對某個遺傳相關的特定疾病有更清晰的了解。
認為未來新醫療的重點就埋藏在人類30億的鹼基對中,解構基因已經不是難題,張明台(Allen)和蘇中才共同創辦亞大基因,期釵足�基因大數據科學家,利用龐大的基因數據加速未來精準醫療。
目前基因定序的主流技術為次世代定序檢測(next-generation sequencing),是短序列片段(short reads)的定序方法,能經過快速且大規模的重組過程來獲取序列資訊,其三大步驟用簡單的比喻來說就是:
在發展新醫療系統Bio-IT時,特別需要兩種角色技能結合的人才:管技術和機器的IT人員,以及擁有生物知識背景懂得解讀數據的生物資訊人員。要找到同時擁有跨域的人才並不容易,因此多數的醫院或醫學中心只能做到維持基因系統,沒有分析技術,無法自建有效率的平台,形成無法跨越的大數據鴻溝,而亞大的團隊剛好擁有結合兩者專業的人才,能夠協助醫療中心或醫療體系建立企業級、真正規模化精準醫療發展的基因數據分析Bio-IT平台。
亞大基因的產品為ATGENOMIX SEQSLAB解決方案,底下主要包含三套產品:
SEQSLAB Connected-Reads:因目前3代定序的成本和錯誤率太高,亞大基因獨家核心技術,使用2.5代軟體定義定序,能同時具備2代和3代定序低成本和長序列雙重優勢。
SEQSLAB PipeSeq:提供業界標準分析流程10倍以上的高擴展性數據規模及分析效能。
SEQSLAB VariantML:基因變異註解、致病性預測機器學習及資料庫開發平台。
這套解決方案可以整套購買,或分開購買單項技術產品,大部分的醫院因為都有自己的基因數據庫,僅缺乏解讀的技術,因此多購買後兩項技術。
張明台與蘇中才本來是趨勢科技的同事,且原本的部門就跟大數據相關,因此具有數據分析技術,「就覺得想要做點有用的事,而不是單純為了好玩,」回憶起當初思考人生下一階段時冒出來的創業念頭,張明台如此說道。
後來因緣際會碰到臺大醫院的醫生,聊到了基因定序在醫學發展的重要性,以及醫生多為研究型人員,面臨醫院空有資料庫卻沒人才會運用技術分析的困境,「既然數據分析的核心技術我們會,這件事又這麼有意義,為什麼不做?」因此兩人離開趨勢科技,開始他們的創業旅程。
值得一提的是,趨勢科技其實很鼓勵員工內部創業,可是張明台和蘇中才認為他們的創業項目和公司領域不太相關,因此還是離職靠自己創業,但也因為看好他們創業項目的潛力,獲得趨勢科技執行長陳怡樺的天使投資做為他們創業的啟動資金。
「我們的產品基本上不會是從零開始,完全擁抱開源策略,」張明台說道,因此亞大基因某種程度上可以說是間開源公司,這也說明了為什麼他們將open source視為最大的競爭對手。而在仰賴開源工具的同時,亞大也設法藉由技術做出差異,在使用任何Google資源時,會一邊找出有問題的地方並連同解決方式回報給Google,形成技術合作。
目前台灣的基因定序產業,大部分的公司都還是在做前段定序代工或開發機器,只有亞大著重在後段分析這塊,這點差異讓他們成為台灣多數醫療中心或醫院的合作夥伴,如和信治癌