2020生資面試經驗筆記(益農、沐恩、安肽)


這是我在應徵生物資訊相關工作的記錄,所以寫得很隨興,想到甚麼就寫進去,分享給大家看看而已。

益農

  • 簡 介
    益農運用遺傳基因體資料分析、生物統計、生物大數據深度學習等技術,致力為全球的農漁畜,食品與環工業者提供專案顧問服務,以改善糧食生產與環境汙染問題,並協助產業達到永續發展之目標。

  • 本職缺主要工作內容

  1. 協助進行全基因體定序資料分析與統計
  2. 生物大數據庫探勘與維護
  3. 研究與開發生物大數據深度學習技術的產業應用和服務
  4. 其他交辦事項
  • 發展遠景
    本職缺除了有機會接觸到基因體大數據於不同領域的運用,並學習到新的分析方法和工具,更可以透過人工智慧技術的開發,協助全球的客戶 解決糧食與環境問題,與世界的舞台接軌 。

  • 學歷要求:碩士以上

  • 科系要求:資訊工程相關、數理統計相關、農林漁牧學科類

  • 語文條件:英文 – 聽 /略懂、說 /略懂、讀 /精通、寫 /中等

  • 擅長工具:
    Linux、Github、C、C++、Java、Matlab、Perl、Python、R

  • 工作技能:不拘

  • 其他條件:

    • 熟悉基本 Linux 指令操作模式 • 具備資訊分析模組撰寫能力,熟悉至少一種常見程式語言(C/C++、Python、R 程式、Perl、Java…)
    • 具備調查樣本統計分析及建立統計精算模型能力
    • 具備資料庫建置(SQL)經驗者尤佳
    • 熟悉至少一種機器學習套件 Scikit learn, PyTorch, Tensorflow, Keras 者等尤佳
    • 熟悉 NGS 基因分析相關軟體,略懂第二代或第三代序列分析原理尤佳
    • 具備程式開發熱忱,認真負責,有團隊合作精神並能獨立思考解決問題
    • 必須有英文文獻閱讀能力。

也許可以問的問題

  1. 入職後實際工作內容
  2. 目前貴公司有使用那些人工智慧套件分析數據
  3. Linux 使用情境

(結果後面兩個我也沒問哈)

面試後心得

這位老闆真的很逗趣,之前信件就感覺出來他好像說話會很隨興,簡訊也是傳 hey man 開頭
面試風格是三家面試以來最輕鬆的一次,完全是用聊天的方式,而且對於之前有去養豬場養豬很有興趣,我前面兩家應都不會想聽,結果他還中途插話多聊很多動科系的事情,真的比較有農業相關的人情味?
其實也沒有問啥專業的問題,主要都是看我說些甚麼經歷而已,再來就是他介紹他們公司的主要服務是做微生物定序,幫助客戶解決問題,但聽下來真的很神奇,雖然大致知道會做甚麼事,但應該是很多元,他們也沒明說會做哪些事情啦(這點我問了,算是被打太極?)。不過整體說很棒,如他所說大概在台灣也沒有其他跟農業相關的公司有在做生物資訊了吧哈哈,哦哦 也沒問啥有沒有其他公司也在面試你之類的問題~ 跟前面兩家真的很不同呢

沐恩生醫

職稱: 人工智慧工程師(生物醫學)

  • 工作內容:

    • 生物醫學相關研究, 如基因, 蛋白質, 藥物等
    • 開發深度學習或機器學習相關演算法
    • 開放資料蒐集與建立
  • 條件:

    • 熟 Python 語法 (快要不熟了…)
    • 熟 windows, Linux 系統 (這個 OK)
    • 熟生化分生,蛋白質體學,基因、蛋白質資料庫 (生化分生不太熟,其餘 OK)
    • 需有閱讀英文論文之基本能力 (當然)
    • 對資料分析、機器學習、深度學習有興趣 (非常有興趣但是還不太熟悉 AI)
    • 有工作熱誠、責任感、學習能力強
    • 具醫療資訊經驗者佳

面試口述自介

流程大概一樣吧 不過我想先開宗名義講我比較熟 R,有學過 python,對人工智慧、機器學習有些基本概念。
自介動科背景,上過那些專業科目。論文主題探討熱緊迫對雞的蛋白質表現和組蛋白修飾程度改變,結論大致上就耐熱的雞隻結構蛋白質、能量代謝相關蛋白質表現量上升。至於組蛋白修飾在質譜分析有很多缺失值導致只能定性而無法定量。
自學過 R,Python 和很多生資軟體(PEAKS, Cytoscape, pyMOL, STRING, GO, KEGG)
用 R 寫過互動式分析網頁
對生物統計也很有興趣
操作系統的 Ubuntu 有學過很多操作,git 也了解

面試後心得

這家果然比較硬,但他們的需求是想要有較多生物背景的人,而且是蛋白質這塊的,不過需要資訊這方面概念還是很硬,跟想要找的生資據面試人員提及的 AI 其實還是跟傳統的生資工作不太相同,恩恩,這點我也認同,因為 AI 更要求開發演算法,建立 AI 模型等,這個職缺往後也是偏向演算法開發的,真的是很具有挑戰性呢科呵呵
至於被問到的問題還真的很多沒有回答出來,像是 Kaggle 是個數據競賽平台啊,中研院有開一個人工智慧學院,需要先考試才能進入,還會被分成不同組別。
還問有用過那些 python 的 AI 套件? 數學方面有沒有學過線性代數和微積分、對於病毒了解多少、藥物開發?資料庫建立?蛋白質的結構?

安肽生醫

面試日期: 2020/01/20

  • 工作內容:

    • 新穎性抗體藥物設計與相關序列整理分析
    • 癌症相關生物資訊應用如 Transcriptome 分析,
    • 次世代序列(NGS)資料處理分析與統整
    • 其他生物資訊相關交辦工作
  • 必須條件:

    • 一年以上學研界或業界相關生物資訊研究經驗 (那就是研究所經驗吧哈)
    • 熟悉 Perl/Python/R/PHP/Java/C++至少其中一種程式語言,能獨立撰寫程式並 具備 LINUX 基本操作能力 (恩恩沒錯 我有)
    • 具備基礎分子生物學、生物化學或免疫學相關知識 (大學、研究所修過的課程應該有些微包含了,至於還記不記得…)
    • 擁有良好的學習能力與態度,能接受挑戰與學習新技能如 AI 新技術 (那當然)
  • 非必須但加分條件:

    • 熟悉 Deep learning 如 CNN、RNN、VAE 與 GAN 等相關技術並能撰寫相關程式 (這倒沒有)
    • 對於機器學習(ML)或其他 AI 技術有相關研究或實作 (這倒是沒有)
    • 抗體序列分析、結構與功能預測等相關研究經驗
    • 熟悉網頁技術語言並擁有架設與開發動態網站相關經驗 (R shiny 的開發也算半成品吧ㄎㄎ)
    • 擁有數理統計分析基礎概念並有實際數據分析經驗 (研究所的統計分析用的可多了)
    • 熟悉次世代序列分析(NGS)流程,有實際分析資料經驗 (之前修 nanopore 就算惹~)

相關資訊:
臺灣國際醫療暨健康照護展 展現臺灣智慧醫療創新力 | 新竹生醫產業與育成中心
公司基本資料 | 經濟部商業司
公司介紹 | 104 人力銀行

研究、開發、設計、製造及銷售下列產品: 1.生長因子、蛋白質及抗體 2.學術研究用 ELISA 檢驗試劑組套 3.新穎癌症三效一體抗體藥物(Neobody®)

董事長叫沈三泰,擁有兩家新創生技公司,主要是在做癌症的標靶藥物,看來是很跟上潮流的在研發蛋白質新藥,不知道能不能撐到開發並開始販售呢,這類的公司就跟遊戲業一樣前期一直燒錢,最後能不能開發出一個熱賣的遊戲也是未知數
終於找到一點這位董事長的背景了,以前應該是在中研院細胞個生所,只是他應該是離職後中研院的介紹連結也失效了
而且這個結晶學委員會最後一次辦的活動是 2010 年…

研究群 | 國際結晶學聯合會中華民國委員會

面試簡報設計

生肽面試前要求以簡報做自介所以規劃了簡報介紹內容
大綱

  • 學經歷
    先快速介紹自己學歷(不過這用肉眼瞬間就看完了耶),規劃這裡花個 3 分鐘吧,輕鬆的敘述,動物科學系都在學那些知識,為何跨領域到生資,也提一些課外活動?(畢竟也沒啥經歷),塑造出一個愛護動物又熱心服務的形象?
    碩士研究主題
    蛋白質體學那裏的人應該都知道,也不用再多提,先說說我們實驗室的研究主題大約有哪些,熱緊迫耐熱、抗凍精液,RNA-seq 跟 DNA 甲基化也可以置入,自己的研究主題則是表觀遺傳學中的組蛋白修飾,接下來提自己在碩士生涯中學到那些技術(二維電泳、iTRAQ、label-free、質譜分析、WB),資料分析的部分要多描述 (GO、KEGG、PPI、PEAKS),但要拿捏時間不要介紹太久,約十分鐘吧
    我們實驗室也是在做體學的研究,其實很適合應用生物資訊的

  • 生物資訊經驗
    這部分就是介紹重點了,也應該是面試者們會有興趣的部分,條列式說明自己對於生資的經驗,包含自學、修過的課程、參加過的研習

    • R
    • Python
    • 開放式網頁(R shiny、GO、KEGG、statistics)
    • 規劃抗體製程
    • 試驗設計 (SAS)
    • Nanopore + freeBSD + Canu
    • Ubuntu 的開始 BLAST 、git
    • 數學演算法(馬卡夫鍊、圖論、分群法)
    • 研習(Pymol、生統、GSEA)
  • 未來規劃
    出國深造、開發軟體、架設伺服器…

面試後感想

幫我面試的是生資研究員,董事長有事就沒來了,不知道是好還是壞
自己算是報告的可缺可點吧,有很多概念應該再說清楚一點的
像是生資分析工具那裡解釋 epitope prediction,或是在說 iTRAQ 和 python 的序列比對程式碼
有個印象比較深刻的是經理問說你可以接受之後 wet 跟 dry 的是都要做嗎?
當然好啊,這就是我希望的,可以兩者並進(這算是 OS 但也就這麼說出口了哈)
也滿訝異面試時居然會多問一些課外的活動
有介紹到懷生社,經理居然還問到我們絕育的資源從哪裡來,也因此我甚至提到了台灣之心
研究員看履歷表問我會彈吉他喔,原來面試也會講到這麼 free 的事情
因為我講很多生資的經驗是來自於去修課
於是他們問我的成績如何,真的好險我有帶成績單欸
因為成績真的都頗高的,所以明顯是加分作用,加上我真的修了很多生資的課
簡報中有把之前在為了實驗室做的 side project 放到 github 上面,
這也真的是好險有把原始碼上傳,當場要求打開來看一些
不過聽的出來他們想要真的有實際跑過流程的人才,尤其是在 NGS 這塊,還有實際分析過 data,我想這可以當成過年期間的功課了,從基因序列資料庫下載 raw data 來分析
整體下來沒有硬到回答不出來的問題,主要都是問些有沒有碰過實驗的經驗還有面對資料會如何處理
結果我實際問他們的問題也只有如果真的來這工作的話,實際內容會是甚麼,大致上就是分析序列資料吧
目前主力是在開發蛋白質新藥,而研究員也說得很隱諱沒有提供太多資訊,但可以知道如果進去就是 support 他的角色

自傳 | 生物資訊

實驗室所學

碩士班時就讀的實驗室主要研究動物蛋白質體,主要技術平台有 SDS-PAGE、western blot 和 LC-MS/MS。我的論文主要探討台灣土雞在熱緊迫後的蛋白質差異表現以及組蛋白修飾變化以了解雞隻的耐熱機制。由於分析技術皆須仰賴質譜儀,使用過 PEAKS 軟體對質譜數據分析蛋白質表現量和組蛋白修飾。

興趣專研

進行的研究需大量運用生物資訊,因而對此有興趣,修習許多相關的課程,也學習 R 與 Python 兩種語言。
實驗室常用的生物資訊分析有 GO、KEGG 和一些常用的統計,雖然有許多線上分析工具可以查詢蛋白質參與功能與路徑,但輸出的結果需要耗費大量時間整理成表格,因此以 R 寫了一個程式整合常用的分析並以瀏覽器的介面呈現,可自動整理結果表格,並將表格內容繪製成各種圖片,如網狀圖、熱圖、有向無環圖等,以減少手動整理花費的時間。

近況

畢業後持續自學 R、Python、統計等與生物資訊相關的知識。為了要更有效的運用生物資訊的軟體與資源,也去熟悉操作 linux 的 distribution-Ubuntu 和 freeBSD,碩班有門基因表現分析學過使用 Nanopore 定序微生物 DNA 序列,並架設 freeBSD 以 canu 軟體分析序列。也常去聽一些校內外相關的演講,像中研院舉辦的生物統計營、國衛院的高通量資訊研習會等以多了解生物資訊的應用。


Author: Hung-Lin, Chen
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint policy. If reproduced, please indicate source Hung-Lin, Chen !
  TOC