
前幾天有個(gè)朋友跑來找我吐槽,說他們公司提交eCTD申報(bào)的時(shí)候,系統(tǒng)彈出一個(gè)"文件過大"的提示,把整個(gè)團(tuán)隊(duì)折騰得夠嗆。他們一邊忙著壓縮文件,一邊心里直犯嘀咕:這文件大小到底有什么限制?為什么之前明明好好的,這次就不行了?
說實(shí)話,這個(gè)問題我被問過不止一次了。每次看到大家著急忙慌地刪減內(nèi)容、轉(zhuǎn)換格式,我就想著,不如把eCTD文件體積這件事兒徹底講清楚。畢竟,與其每次都手忙腳亂,不如從根本上搞清楚規(guī)則是什么。
所以今天這篇文章,我想用最實(shí)在的方式,跟大家聊聊eCTD電子提交中關(guān)于文件體積大小的那些規(guī)定和門道。咱們不搞那些晦澀難懂的官方腔調(diào),就用大白話把事情說透。
在聊文件大小之前,我覺得有必要先簡(jiǎn)單說說eCTD是什么。畢竟有些朋友可能只是偶爾接觸到這個(gè)詞,對(duì)它的全貌不太熟悉。
eCTD,全稱是Electronic Common Technical Document,也就是"電子通用技術(shù)文檔"。簡(jiǎn)單理解,它是制藥企業(yè)向藥品監(jiān)管部門提交注冊(cè)申報(bào)資料的標(biāo)準(zhǔn)化電子格式。你可以把想象成一份電子版的"護(hù)照",只不過這本"護(hù)照"里面裝的是藥品的"身份信息"——包括藥品的安全性、有效性、質(zhì)量控制等所有技術(shù)資料。
為什么要用電子格式?原因很實(shí)在。以前紙質(zhì)提交的時(shí)候,一份完整的申報(bào)資料可能重達(dá)幾十公斤,搬運(yùn)、存儲(chǔ)、查閱都不方便。改成電子格式后,一切都變得輕便起來。但電子化也帶來了新問題:文件太大了怎么辦?網(wǎng)絡(luò)傳輸不了怎么辦?系統(tǒng)處理不了怎么辦?這些問題,正是文件體積限制規(guī)定誕生的初衷。
值得一提的是,eCTD并不是某一個(gè)國(guó)家或地區(qū)的"土規(guī)定",而是一個(gè)國(guó)際化的標(biāo)準(zhǔn)。現(xiàn)在美國(guó)FDA、歐洲藥品管理局(EMA)、日本厚生勞動(dòng)省、中國(guó)國(guó)家藥品監(jiān)督管理局(NMPA)等主要藥品監(jiān)管機(jī)構(gòu)都接受或要求eCTD格式。當(dāng)然,不同地區(qū)在具體執(zhí)行上會(huì)有一些差異,這個(gè)我們后面會(huì)詳細(xì)說。

好,現(xiàn)在進(jìn)入正題。eCTD電子提交對(duì)文件體積大小究竟有什么限制?
這個(gè)問題表面上看起來簡(jiǎn)單,答案卻不怎么"簡(jiǎn)單"。因?yàn)閲?yán)格來說,eCTD標(biāo)準(zhǔn)本身并沒有規(guī)定一個(gè)絕對(duì)的"天花板"數(shù)字。什么意思?國(guó)際人用藥品注冊(cè)技術(shù)協(xié)調(diào)會(huì)(ICH)制定的eCTD規(guī)范,主要關(guān)注的是文檔結(jié)構(gòu)、內(nèi)容框架、元素定義等方面,而把具體的文件大小限制留給了各個(gè)地區(qū)監(jiān)管部門自行決定。
這就好比ICH畫了一個(gè)"骨架",各個(gè)地區(qū)根據(jù)自己的實(shí)際情況往里面填充"血肉"。所以,你不能只去看eCTD國(guó)際規(guī)范就以為找到了全部答案,還得看你打算向哪個(gè)監(jiān)管部門提交申報(bào)。
不過,這并不意味著我們沒辦法摸清規(guī)律。根據(jù)我的了解,大多數(shù)監(jiān)管機(jī)構(gòu)對(duì)單個(gè)文件的大小限制普遍設(shè)定在100MB左右。這個(gè)數(shù)字不是隨便定的,而是綜合考慮了系統(tǒng)處理能力、網(wǎng)絡(luò)傳輸效率、文件打開速度等多方面因素之后的一個(gè)"平衡點(diǎn)"。
為什么是100MB左右?你可以這樣想:如果文件太大,系統(tǒng)打開和預(yù)覽的時(shí)候會(huì)變得很慢甚至卡頓,嚴(yán)重影響審評(píng)效率。特別是審評(píng)員每天要審閱大量文件,如果每個(gè)文件都要等半天才能打開,那整個(gè)工作進(jìn)度都會(huì)受影響。另一方面,從技術(shù)角度來說,很多傳統(tǒng)的文檔處理工具在處理超大文件時(shí)確實(shí)存在性能瓶頸。
當(dāng)然,100MB并不是一個(gè)"鐵律"。不同地區(qū)、不同類型的申報(bào)、不同年份發(fā)布的指南可能會(huì)有細(xì)微差別。有些機(jī)構(gòu)可能設(shè)定的是50MB,有些可能放寬到200MB。所以最好的辦法,還是在你準(zhǔn)備提交之前,去目標(biāo)監(jiān)管機(jī)構(gòu)的官網(wǎng)上查最新的指南文件。白紙黑字寫在那里的,才是最可靠的。
前面說過,各地區(qū)對(duì)eCTD文件大小的具體限制可能有所不同。咱們挑幾個(gè)主要的監(jiān)管機(jī)構(gòu)來說說,這樣你心里能有個(gè)更具體的數(shù)。

美國(guó)食品藥品監(jiān)督管理局(FDA)是全球藥品監(jiān)管機(jī)構(gòu)中接受eCTD格式的"老前輩"之一。FDA對(duì)eCTD提交有比較詳細(xì)的技術(shù)規(guī)范,其中就包括對(duì)文件大小的要求。
根據(jù)FDA發(fā)布的eCTD技術(shù)規(guī)范文檔,單個(gè)文件的大小建議控制在100MB以內(nèi)。需要注意的是,這只是一個(gè)"建議"而非強(qiáng)制性的"必須",但在實(shí)際操作中,如果文件超過這個(gè)大小,可能會(huì)遇到提交障礙。FDA的電子提交系統(tǒng)在對(duì)文件進(jìn)行處理時(shí),如果檢測(cè)到超大文件,可能會(huì)彈出警告甚至拒絕接收。
另外,F(xiàn)DA對(duì)整個(gè)申報(bào)包的大小也有隱性的"期望"。雖然官方?jīng)]有明確說整個(gè)eCTD模塊不能超過多少GB,但考慮到系統(tǒng)性能,整個(gè)模塊大小最好控制在2GB以內(nèi)。如果你的申報(bào)資料特別復(fù)雜,比如涉及大量的臨床試驗(yàn)數(shù)據(jù)或研究資料,那可能需要考慮分批提交或者采用其他技術(shù)手段來處理。
歐洲藥品管理局(EMA)采用的是eCTD格式,但歐洲的情況稍微復(fù)雜一點(diǎn),因?yàn)闅W盟成員國(guó)眾多,各國(guó)監(jiān)管機(jī)構(gòu)在執(zhí)行層面可能會(huì)有細(xì)微差異。不過總體來說,EMA對(duì)eCTD文件大小的限制跟FDA比較接近。
EMA的eCTD提交系統(tǒng)對(duì)單個(gè)文件的限制通常也是100MB左右。需要特別說明的是,EMA在2020年前后對(duì)他們的提交系統(tǒng)進(jìn)行過一次升級(jí),對(duì)文件大小、格式要求等方面都做了更新。所以如果你之前有過向EMA提交的經(jīng)驗(yàn),現(xiàn)在再去提交的話,建議再確認(rèn)一下最新的要求有沒有變化。
還有一點(diǎn)值得一提的是,EMA對(duì)PDF文件的版本有明確要求。根據(jù)我的了解,EMA目前要求提交PDF 1.4版本或更高版本的文檔。如果你用了更新的PDF版本,可能會(huì)導(dǎo)致系統(tǒng)識(shí)別出現(xiàn)問題。這一點(diǎn)看似跟文件大小不直接相關(guān),但有時(shí)候轉(zhuǎn)換PDF版本的過程中可能會(huì)影響文件體積,所以順便提一下。
咱們國(guó)家藥品監(jiān)督管理局(NMPA)對(duì)eCTD電子提交也在逐步推進(jìn)中。根據(jù)NMPA發(fā)布的《eCTD技術(shù)規(guī)范》及相關(guān)指南,中國(guó)對(duì)eCTD文件體積的要求與國(guó)際主流標(biāo)準(zhǔn)保持一致。
NMPA對(duì)單個(gè)PDF文件的大小限制通常也是100MB。同時(shí),整個(gè)eCTD文檔包的大小建議控制在合理范圍內(nèi)。雖然沒有看到一個(gè)硬性的"上限數(shù)字",但從實(shí)際操作角度來說,把整個(gè)模塊控制在幾個(gè)GB以內(nèi)是比較穩(wěn)妥的做法。
值得注意的是,中國(guó)eCTD實(shí)施是分階段推進(jìn)的。不同類型的申報(bào)(化藥、生物制品等)、不同的申報(bào)類型(臨床試驗(yàn)申請(qǐng)、上市許可申請(qǐng)等)可能在具體要求上有所差異。所以,在準(zhǔn)備中國(guó)區(qū)的eCTD申報(bào)時(shí),最好仔細(xì)研讀NMPA發(fā)布的對(duì)應(yīng)類型申報(bào)的eCTD技術(shù)規(guī)范。
聊完了規(guī)定,我們來說點(diǎn)更實(shí)用的話題。如果你的文件確實(shí)超過了限制大小,該怎么辦?總不能因?yàn)槲募缶桶阎匾难芯繑?shù)據(jù)刪掉吧?
別著急,辦法還是有的。
在eCTD申報(bào)資料中,圖片和圖表往往是體積的"大戶"。一張高清的臨床試驗(yàn)影像或者質(zhì)量控制圖,可能隨隨便便就幾十MB甚至更大。這時(shí)候,壓縮圖片體積就變得很有必要。
但壓縮也不是隨便壓的。你需要在文件大小和圖片質(zhì)量之間找到一個(gè)平衡點(diǎn)。壓得太狠,圖片變得模糊不清,審評(píng)員看不清楚細(xì)節(jié),那可就不太好了。一般來說,將圖片分辨率控制在150-300dpi之間是個(gè)比較合理的范圍。既能保證肉眼觀察的清晰度,又不會(huì)讓文件變得太大。
另外,有些申報(bào)資料里的截圖可能是從更高分辨率的原始圖直接截取的,這種情況下可以嘗試調(diào)整截圖的尺寸。有時(shí)候你本來需要的是一張全分辨率的圖,但其實(shí)審評(píng)員只需要看局部細(xì)節(jié),那完全可以裁剪一下,只保留需要的部分。
有時(shí)候你會(huì)發(fā)現(xiàn),明明文件內(nèi)容不多,PDF體積卻大得嚇人。這可能是PDF內(nèi)部結(jié)構(gòu)的問題。比如,PDF里面嵌入了大量的字體文件、重復(fù)的元素、或者無效的元數(shù)據(jù)。
這時(shí)候可以使用一些PDF優(yōu)化工具,對(duì)文件進(jìn)行"瘦身"。這些工具能夠識(shí)別并移除PDF中不必要的元素,重新組織內(nèi)部結(jié)構(gòu),從而在不損失內(nèi)容的前提下減小文件體積。
不過需要注意的是,優(yōu)化后的PDF一定要仔細(xì)檢查一遍,確保所有內(nèi)容都完整、清晰。我就聽說過有人優(yōu)化完P(guān)DF,結(jié)果發(fā)現(xiàn)有些頁面的文字變得模糊或者圖表出現(xiàn)錯(cuò)位的情況。這種低級(jí)錯(cuò)誤千萬要避免。
eCTD的文檔結(jié)構(gòu)本身就支持你把相關(guān)的內(nèi)容分散到不同的文件中。比如,你可以創(chuàng)建一個(gè)主文件用于展示數(shù)據(jù)的匯總和分析結(jié)論,然后把完整的原始數(shù)據(jù)拆分成幾個(gè)子文件,通過超鏈接的方式與主文件關(guān)聯(lián)起來。這樣既保證了內(nèi)容的完整性,又避免了單個(gè)文件過大。
當(dāng)然,拆分文件的時(shí)候要注意保持邏輯清晰。審評(píng)員在審閱的時(shí)候應(yīng)該能夠方便地找到他需要的信息,而不會(huì)在文件堆里迷路。建議在主文件中做好清晰的索引和指引。
說到文件大小這件事,除了那些"大規(guī)則"之外,還有一些"小細(xì)節(jié)"也值得留意。因?yàn)橛袝r(shí)候恰恰是這些不起眼的細(xì)節(jié),把你的文件體積給撐大了。
你知道嗎?你的文檔里可能藏著很多"看不見"的東西。比如Word文檔的修訂記錄、批注、作者信息、創(chuàng)建日期等元數(shù)據(jù)。這些數(shù)據(jù)在轉(zhuǎn)換為PDF之后有時(shí)候會(huì)保留下來,雖然你看不見它們,但它們實(shí)實(shí)在在占著空間。
p>特別是如果你的文檔經(jīng)過多人多次修訂,元數(shù)據(jù)可能會(huì)變得相當(dāng)臃腫。在最終提交之前,建議把這些"隱藏信息"都清理干凈。清理的方法不難,Word里有"刪除文檔信息"的功能,Adobe Acrobat也有相應(yīng)的清理工具。有時(shí)候,為了保證文檔在不同電腦上顯示效果一致,有人會(huì)把所有用到的字體都嵌入到PDF中。這個(gè)出發(fā)點(diǎn)是好的,但如果你的文檔使用了大量的特殊字體,嵌入操作可能會(huì)讓文件體積膨脹不少。
我的建議是,對(duì)于正文字體,使用系統(tǒng)自帶的通用字體就可以了,比如Times New Roman、Arial等。這些字體幾乎所有電腦都有,沒必要額外嵌入。只有對(duì)于某些特殊的符號(hào)、字體,才需要考慮嵌入的問題。
雖然這種情況比較少見,但確實(shí)有人問過:如果申報(bào)資料里需要包含視頻或音頻文件,eCTD怎么處理?
一般來說,eCTD規(guī)范并不鼓勵(lì)在申報(bào)資料中直接嵌入大體積的視頻或音頻文件。如果確實(shí)需要這部分內(nèi)容,通常的做法是提供一個(gè)鏈接,指向外部存儲(chǔ)或者專門的系統(tǒng)。當(dāng)然,具體怎么處理,還得看你打算向哪個(gè)監(jiān)管機(jī)構(gòu)提交,對(duì)方對(duì)此有沒有具體規(guī)定。
聊了這么多,最后我想給大家?guī)讞l比較實(shí)用的建議。這些建議可能不會(huì)出現(xiàn)在官方法規(guī)指南里,但都是我這些年觀察下來的經(jīng)驗(yàn)之談。
第一點(diǎn),也是最重要的一點(diǎn):在動(dòng)手做文檔之前,先把目標(biāo)監(jiān)管機(jī)構(gòu)的最新指南讀一遍。官方的指南文件通常會(huì)寫得比較詳細(xì),告訴你哪些能做、哪些不能做。與其憑著自己的理解悶頭做,做到一半發(fā)現(xiàn)不符合要求要推倒重來,不如一開始就把規(guī)則搞清楚。
第二點(diǎn),找個(gè)靠譜的工具。eCTD制作不是簡(jiǎn)單地Word轉(zhuǎn)PDF就行,它涉及到嚴(yán)格的文檔結(jié)構(gòu)、文件命名、目錄層級(jí)等要求。一款好的eCTD制作軟件能夠幫你避免很多低級(jí)錯(cuò)誤,也能實(shí)時(shí)檢測(cè)文件大小是否超標(biāo)。現(xiàn)在市面上這類型的軟件不少,各有各的特點(diǎn),你可以根據(jù)自己的需求和預(yù)算來選擇。
第三點(diǎn),預(yù)留充足的準(zhǔn)備時(shí)間。我見過太多次,大家等到臨近截止日期才開始準(zhǔn)備eCTD申報(bào),結(jié)果發(fā)現(xiàn)文件大小有問題,急得團(tuán)團(tuán)轉(zhuǎn)。壓縮圖片、優(yōu)化PDF、拆分文件這些操作,哪一個(gè)不需要時(shí)間?如果時(shí)間緊,動(dòng)作就容易變形,就容易出錯(cuò)。我的建議是,至少在截止日期前兩到三周就開始準(zhǔn)備eCTD文檔,給自己留出足夠的"余量"來處理各種意外情況。
第四點(diǎn),做好版本管理。eCTD申報(bào)往往需要多次修改和補(bǔ)充,每次提交新版本的時(shí)候都要確保文件的完整性和一致性。如果文件管理混亂,很容易出現(xiàn)版本搞混、文件遺漏這些問題。建議用清晰的命名規(guī)則來標(biāo)識(shí)不同版本的文檔,并且保留完整的修改記錄。
eCTD電子提交這件事,說復(fù)雜也復(fù)雜,說簡(jiǎn)單也簡(jiǎn)單。復(fù)雜在于各個(gè)地區(qū)的規(guī)定細(xì)節(jié)多、要求嚴(yán),一不小心就可能踩坑;簡(jiǎn)單在于規(guī)則都是公開的,只要按部就班地來做,大多數(shù)問題都能避免。
文件體積大小的限制,說到底不是為難誰,而是為了讓整個(gè)注冊(cè)提交流程更加順暢高效。文件太大,系統(tǒng)處理不了,審評(píng)員看不方便,最后影響的是申報(bào)進(jìn)度。所以這些規(guī)定,歸根結(jié)底是在幫助大家更好地完成申報(bào)工作。
如果你在準(zhǔn)備eCTD申報(bào)的過程中遇到任何問題,或者對(duì)某些規(guī)定還有不清楚的地方,建議多跟有經(jīng)驗(yàn)的人交流交流。有時(shí)候別人的一句話,可能就幫你省下好幾個(gè)小時(shí)的折騰。
希望今天這篇文章能給你帶來一點(diǎn)有用的信息。如果覺得讀起來還算順暢,那我就滿足了。畢竟,寫這些文字的初衷,就是希望能夠?qū)崒?shí)在在地幫到正在這個(gè)領(lǐng)域里努力的朋友們。
