ไม่ว่าคุณจะมองในแง่ใด ความต้องการข้อมูลและการคำนวณของสถาบันสุขภาพแห่งชาตินั้นมีขนาดใหญ่จนน่ากลัว NIH ประกอบด้วย 27 สถาบันหรือศูนย์ ซึ่งรวมถึงห้องปฏิบัติการประมาณ 110 ห้อง เครือข่ายการวิจัยแบบกระจายของหน่วยงานจะย้ายข้อมูลหกเพตะไบต์ทุกวัน นอกจากนี้ NIH ยังให้ทุนสนับสนุนการวิจัยในมหาวิทยาลัยและศูนย์การแพทย์กว่า 2,500 แห่ง โดยใช้จ่ายมากกว่า 4 หมื่นล้านดอลลาร์ในแต่ละปี
จากมุมมองด้านเทคโนโลยีสารสนเทศ NIH เป็นเรื่องเกี่ยว
กับข้อมูลขนาดใหญ่และการคำนวณทางวิทยาศาสตร์ขนาดใหญ่ เมื่อพิจารณาจากขนาดและขอบเขตของข้อมูลและแอปพลิเคชัน ประกอบกับลักษณะการทำงานร่วมกันทั่วโลกของกิจกรรม NIH จึงไม่น่าแปลกใจที่การประมวลผลแบบคลาวด์เชิงพาณิชย์ได้กลายเป็นส่วนสำคัญและสำคัญของแนวทางด้านไอทีของหน่วยงาน
การวางแผนและการทำสัญญากับระบบคลาวด์ส่วนใหญ่ตกอยู่ที่ศูนย์เทคโนโลยีสารสนเทศของ NIH Andrea Norris หัวหน้าเจ้าหน้าที่ ฝ่ายข้อมูลของ บริษัท จัดการเรื่องนี้ทั้งหมดเมื่อเธอพูดที่Cloud Exchangeของ Federal News Network
ข้อมูลเชิงลึกโดย MFGS, Inc.: ค้นหาว่าเหตุใดการจัดการสายธารคุณค่าจึงได้รับความนิยมในฐานะกรอบงานสำหรับการวัดมูลค่าในสภาพแวดล้อม DevSecOps
“หลายสิ่งที่เราสนับสนุนอยู่ในบิ๊กดาต้า ที่เก็บข้อมูลทางวิทยาศาสตร์” นอร์ริสกล่าว “นั่นเป็นส่วนสำคัญของเทคโนโลยีและทรัพยากรข้อมูลของเรา”
ยิ่งไปกว่านั้น ข้อมูลนั้น ซึ่งสุดท้ายแล้วจ่ายด้วยเงินภาษีและเป็นของสาธารณะ
“ข้อมูลจำนวนมากของเราเข้าถึงได้แบบสาธารณะ เป็นสาธารณสมบัติ เราเปิดให้บุคคลทั่วไปสามารถเข้าถึงได้ และโดยเฉพาะอย่างยิ่งสำหรับนักวิจัยทั่วโลก” นอร์ริสกล่าว “เราเป็นผู้สนับสนุนรายใหญ่ของการเข้าถึงข้อมูลสาธารณะ และสำหรับวิทยาศาสตร์ เราเชื่อว่าการเข้าถึงแบบเปิดเป็นวิธีการเร่งการค้นพบ ดังนั้นเราจึงมีที่เก็บข้อมูลแบบเป็นโปรแกรมและแบบเฉพาะสาขาวิชาขนาดใหญ่มาก พร้อมเครื่องมือคำนวณและตัวช่วยในการทำงาน ที่ซึ่งนักวิจัยเข้ามาดำเนินการด้านวิทยาศาสตร์”
ซึ่งอาจไม่น่าแปลกใจเลยที่ทำให้ระบบคลาวด์เป็นตัวเลือก
ที่สมเหตุสมผลสำหรับการโฮสต์ข้อมูลและเครื่องมือทั้งหมดที่สถาบันครอบคลุม Norris อธิบายว่า อันที่จริงแล้ว การโยกย้ายระบบคลาวด์เป็นสิ่งที่ NIH Center for Information Technology ทำมาตลอดหลายปีที่ผ่านมา การนำระบบคลาวด์มาใช้อยู่ภายใต้โครงการที่เรียกว่า STRIDES Initiative ซึ่งเป็นส่วนหนึ่งของแผนกลยุทธ์ด้านวิทยาศาสตร์ข้อมูลของเอเจนซี
STRIDES ย่อมาจากโครงสร้างพื้นฐานการวิจัยวิทยาศาสตร์และเทคโนโลยีเพื่อการค้นพบ การทดลอง และความยั่งยืน NIH ภายใต้ STRIDES ได้สร้างความสัมพันธ์กับผู้ให้บริการคลาวด์เชิงพาณิชย์รายใหญ่สามราย ได้แก่ Google Cloud, Amazon Web Services และ Microsoft Azure
สัญญา — นอร์ริสเรียกพวกเขาว่าความสัมพันธ์ — กับบริษัทต่างๆ ได้นำต้นทุนที่เหมาะสมมาสู่สถาบันแต่ละแห่งและแก่ผู้ได้รับทุนวิจัยทั่วทั้งสถาบันการศึกษาเพื่อสนับสนุนการนำระบบคลาวด์ไปใช้
Norris กล่าวว่าการจัดการได้ทำงาน
ในช่วงสองปีที่ผ่านมา STRIDES ส่งผลให้ข้อมูลทางวิทยาศาสตร์มากกว่า 110 เพตะไบต์ ซึ่งเท่ากับ 112,600 เทราไบต์ ย้ายเข้าสู่สภาพแวดล้อมระบบคลาวด์“นักวิจัยที่ได้รับทุนสนับสนุนของเราใช้เวลาประมวลผลมากกว่า 100 ล้านชั่วโมงในระบบคลาวด์” นอร์ริสกล่าว “เราได้ฝึกอบรมนักวิจัยมากกว่า 4,000 คนเกี่ยวกับวิธีใช้ระบบคลาวด์” ความพยายามในการฝึกอบรมครอบคลุม “ทุกอย่างตั้งแต่พื้นฐานไปจนถึงขั้นสูง และที่สำคัญกว่านั้นคือ วิธีทำการประมวลผลทางชีวการแพทย์ในระบบคลาวด์ จริงๆ แล้ววิธีการทำงานแบบเราต้องเห็นนักวิจัยของเราทำ”
“และเรากำลังประหยัดเงินเพราะส่วนลดจะเกิดขึ้นกับสภาพแวดล้อมการวิจัยโดยรวม” นอร์ริสกล่าวเสริม “ยิ่งเราเคลื่อนไหวมากเท่าไหร่ ส่วนลดก็ยิ่งดีขึ้นเท่านั้น”
โปรแกรม STRIDES ยังช่วยส่งเสริมภารกิจด้านสุขภาพอีกด้วย นอร์ริสยกตัวอย่างว่าลำดับพันธุกรรมของไวรัสโควิด-19 เสร็จสิ้นในเดือนมกราคม ข้อตกลงดังกล่าวทำให้ NIH สามารถแบ่งปันข้อมูลทั่วโลกได้ทันที ซึ่งจุดประกายให้เกิดแรงผลักดันการวิจัยระดับโลกเกี่ยวกับวัคซีน
ดังนั้น คลาวด์จึง “เปลี่ยนแปลงวิธีการทำงานด้านวิทยาศาสตร์อย่างแท้จริง” นอร์ริสกล่าว
จากมุมมองทางสถาปัตยกรรม Norris กล่าวว่า วิธีการเริ่มต้นในการหลีกเลี่ยงค่าใช้จ่ายในการดาวน์โหลดข้อมูลคงที่คือการสร้างพื้นที่ทำงานร่วมกันในระบบคลาวด์ที่มีเครื่องมือวิเคราะห์ ยูทิลิตี้ และการแสดงภาพ นั่นคือวิธีการนำการคำนวณไปยังข้อมูลแทนที่จะเป็นวิธีอื่น
“นั่นคือรูปแบบที่เราสนับสนุน” นอร์ริสกล่าว “ชุดข้อมูลบางชุดมีขนาดใหญ่เกินไป คุณไม่สามารถทำอย่างอื่นได้”