06 เมษายน 2551

สารพันรูปแบบไฟล์เพลง ภาค Lossy แถมตั้ง mp3 ยังไงถึงจะแหล่ม

บทความนี้ตีพิมพ์ในนิตยสาร PCtoday ฉบับที่ 45 เดือนมกราคม ปี 2551 ครับ แต่เห็นว่ามีประโยชน์เลยเอาฉบับเต็มมาให้อ่านในนี้ด้วย

-------
ในเย็นวันศุกร์ หลังจากผ่านวันอันแสนวุ่นวายมาตลอดสัปดาห์ ผมตั้งใจว่าจะปล่อยใจล่องลอยให้ผ่อนคลายไปกับเสียงเพลงของวงดนตรีสุดโปรด เราเองก็จัดแจงซื้อซีดีเพลงมาเรียบร้อย ขณะกำลังเตรียมแปลงเพลงเป็น mp3 (rip) ลง notebook อยู่นั้น (เค้าเรียกว่าหวงแผ่น CD จะได้ไม่ต้องใช้แผ่นบ่อยๆ ให้เป็นรอย) ก็เกิดสงสัยว่าเราจะทำไฟล์ออกมาแบบไหนดี ตั้งค่ายังไงขนาดมันถึงจะเล็กแล้วเสียงยังดีอยู่
-------


ผมสงสัยเรื่องนี้มานานพอสมควร เพราะมันมีรูปแบบไฟล์เยอะเหลือเกินตั้งแต่ mp3, ogg, aac, flac, wavpack แล้วรูปแบบไหนที่มันดีสำหรับเรากัน แล้วควรจะตั้งค่ามันยังไง ตั้ง kbps เท่าไหร่ เสียงถึงจะเดิ้น ด้วยความอยากรู้ผมจึงไปค้นข้อมูลมาอ่าน แล้วก็นำมาเล่าสู่กันฟังครับ แหะๆ บทความนี้อาจจะซับซ้อนแล้วก็เต็มไปด้วยเรื่องทางวิทยาศาสตร์นะครับ เพราะเสียงคือวิทยาศาสตร์สาขาหนึ่ง ผมจะพยายามเขียนให้เข้าใจง่ายที่สุด แต่ถ้าขี้เกียจอ่านเรื่องพื้นฐานยุ่งๆ ของมัน ก็ข้ามไปอ่านสรุปของแต่ล่ะส่วน (ย่อหน้าสุดท้าย) ได้เลยครับ แต่ผมก็สนับสนุนให้รู้พื้นฐานไว้ด้วยจะดีมาก เพราะจะได้นำไปประยุกต์ใช้ได้กว้างขึ้น เอาแหละเรามาเริ่มกันที่เรื่องพื้นฐานของเสียงกันก่อนดีกว่าครับ

พื้นฐานการบีบอัดเสียง
จากความรู้วิทยาศาสตร์น่าจะสมัยม.ต้น ที่บอกว่าคนเรายินเสียงช่วงความถี่ตั้งแต่ 20 – 20,000 Hz ครับ เจ้าเลขนี้จะบอกว่าวัตถุที่กำเนิดเสียงสั่นด้วยอัตรากี่ครั้งต่อวินาที เช่นที่ 35 Hz ลำโพงก็จะสั่น 35 ครั้งต่อวินาที เราจะได้ยินเป็นเสียงต่ำครับ ส่วนความถี่ที่สูงๆ ขึ้นอย่าง 15,000 Hz จะได้ยินเป็นเสียงสูง แต่ใช่ว่าทุกคนจะยินเสียงครบทั้งหมดแบบนี้หรอกครับ เพราะประสาทหูเราจะค่อยๆ เสื่อมลง ในวัยผู้ใหญ่จึงอาจจะรับเสียงได้แค่ช่วง 20-15,000 Hz ชัดเจนเท่านั้น ส่วนเสียงอื่นๆ ก็ยังได้ยินอยู่แต่ว่าจะได้ยินเบาลง จนบางทีก็ไม่รู้สึกว่ามีเสียงนี้อยู่
แล้วในเรื่องเสียงภาคดิจิตอลยังมีตัวเลขอีก 2 ตัวเข้ามาเกี่ยวข้องครับ นั้นคือ bit depth เช่นที่มักเห็นเป็น 16 bit กับ 24 bit และ sample rate อย่าง 44,100 Hz หรือ 48,000 Hz การจะเข้าใจเรื่องนี้เราต้องเข้าใจเรื่องดิจิตอลก่อนครับ อย่างที่รู้ๆ กันครับว่าดิจิตอลเก็บข้อมูลเป็น 0 กับ 1 แต่ถ้ามันเก็บได้แค่นี้ สงสัยเราคงได้ยินแต่เสียงอิ้ดๆ แน่ๆ การเก็บเสียงเสียงดิจิตอลจึงต้องใช้ชุดของข้อมูล ถึงจะเก็บข้อมูลเสียงได้ครบ

ภาพนี้เป็นเสียง 4 bit ครับ จะเห็นว่ามีค่าทั้งหมด 16 ค่า (0-15) ในแกน y

ดูในภาพนะครับ คลื่นเสียงที่เห็นจะมีลักษณะเส้นโค้งๆ นะครับ มีสองแกนคือแกนตั้งกับแกนนอน ซึ่ง bit depth จะเกี่ยวข้องกับแกนตั้งครับ จำนวน bit depth คือจำนวนข้อมูลที่อ้างอิงได้ในแกนตั้งครับ ถ้าเก็บ 1 bit จะอ้างอิงเสียงได้ 2 ค่า อย่าง 4 bit อ้างอิงได้ 16 ค่า แล้ว 16 bit จะอ้างอิงได้ 65,536 ค่า จะเห็นว่ายิ่งเลขมากข้อมูลที่เก็บได้ยิ่งละเอียด
ส่วนอีกค่าหนึ่งคือ sample rate ค่านี้จะแทนแกนนอน มีความหมายว่าใน 1 วินาทีจะมีการเก็บข้อมูลกี่ครั้ง อย่าง 44,100 ก็คือใน 1 วินาทีจะมีการเก็บข้อมูล 44,100 ครั้งครับ ยิ่งเลขมาก ข้อมูลที่เก็บได้ก็จะยิ่งละเอียด ค่าที่เห็นบ่อยๆ คือ 44,100 Hz เพราะเป็นความละเอียดที่ใช้บนแผ่น CD เพลง แหะๆ แอบเห็นหน้างง งั้นดูภาพครับ
ภาพนี้ใช้ bit depth ที่ 16 bit มีค่าตั้งแต่ -32,768 ถึง 32,767 และมีแท่งตั้งๆ แทนจำนวนการเก็บข้อมูล 44,100 แท่งแทน 44,100 ครั้งต่อวินาที


แล้วทำไมยิ่ง bit-depth และ sample rate สูงแล้วยิ่งเก็บข้อมูลเสียงได้ละเอียด เราลองมาดูภาพนี้กันนะครับ
เส้นสีเทาคือสัญญาณเสียงในระบบอนาล็อก หรือเสียงจากธรรมชาติครับ การจะนำมาเก็บเป็นข้อมูลดิจิตอล เส้นสีเทาจะถูกแปลงเป็นเส้นสีแดง ซึ่งจะเห็นได้ว่ามันไม่ทับกัน แค่ใกล้เคียงกัน เพราะสัญญาณดิจิตอลจะอ้างอิงลักษณะของคลื่นเสียงจาก sample rate (แกนนอน) และ bit-depth (แกนตั้ง) เพื่อนำมาแทนเสียง เราจะเห็นความละเอียดของทั้งสองแกนจากช่องสี่เหลี่ยมปะๆ ด้านหลังเส้นครับ เพราะฉะนั้นยิ่งมี sample rate และ bit-depth ที่สูงขึ้น ช่องสี่เหลี่ยมปะๆ ที่ใช้อ้างอิงสัญญาณดิจิตอลก็จะยิ่งถี่ขึ้น ละเอียดขึ้น สัญญาณที่สร้างจากแกนอ้างอิงนี้จึงละเอียดขึ้นด้วย จนสามารถแทนเสียงธรรมชาติได้ใกล้เคียงที่สุด
สรุปนะครับ ยิ่ง bit-depth มาก และ sample rate สูง เสียงก็จะยิ่งดี แต่มีข้อควรจำอยู่ว่า ถ้าต้นฉบับมี bit-depth และ sample rate อยู่แล้ว การไปเพิ่มให้มันสูงขึ้น ไม่ได้ทำให้เสียงดีขึ้นนะครับ เพราะคุณจะเอาข้อมูลที่ไหนไปเพิ่มให้กับเสียงที่มีข้อมูลอยู่เท่านั้น แถมยังทำให้ไฟล์ใหญ่ขึ้นโดยไม่มีประโยชน์อีกตั้งหาก เช่นแผ่น CD มี bit-depth ที่ 16 bit และ sample rate ที่ 44,100 Hz การที่เราไปสั่ง rip เพลงให้เป็น mp3 ที่มี sample rate 48,000 Hz ไม่ทำให้เสียงดีขึ้นครับ

ประเภทของการบีบอัดเสียง
การบีบอัดเสียงมี 2 ประเภทครับ คือแบบ lossless กับ lossy ซึ่ง lossless คือการบีบอัดที่ไม่มีการเสียข้อมูลเสียงเลย ต้นฉบับเป็นอย่างไร ไฟล์ที่บีบอัดแล้ว เมื่อคลายออกมาจะเหมือนเดิมเป๊ะๆ แต่ข้อเสียของไฟล์ประเภทนี้คือขนาดที่ค่อนข้างใหญ่กว่าแบบ lossy พอสมควร
เราจะดูจำนวนข้อมูลที่ใช้จาก bit rate ซึ่งมีหน่วยเป็น kbps ครับ มันย่อมาจาก kilo bit per second หรือจำนวนบิตที่ใช้ใน 1 วินาที ยิ่งใช้บิตต่อวินาทีมาก จะเก็บข้อมูลได้มาก แต่ขนาดไฟล์ก็จะยิ่งใหญ่ครับ
อย่างไฟล์ FLAC กับเพลงยาว 5 นาที จะใช้พื้นที่ราวๆ 30 Mb ถ้าดูที่ bit rate ก็จะใช้ราวๆ 900 kbps (เพลงในแผ่น CD จะใช้ bit rate ที่ 1411 kbps ครับ) เทียบกับ mp3 ทั่วๆ ไปที่ใช้ 128 kbps ก็จะใหญ่กว่า 8-9 เท่าเลยทีเดียว แต่แน่นอนว่าเสียงดีกว่ากันแบบเทียบกันไม่ได้เลย รูปแบบไฟล์ที่เป็นแบบ lossless ก็เช่น FLAC, WavPack, Apple Lossless, WMA Lossless ครับ ส่วน wav ไม่ถือว่าเป็น lossless นะครับ เพราะไม่ได้บีบข้อมูลอะไร
ส่วน Lossy คือการบีบอัดที่ทิ้งข้อมูลออกไปบ้าง เช่นเสียงสูงๆ เหนือกว่า 15000 Hz ก็จะถูกตัดทิ้งออกไป ส่วนจะตัดอย่างไรบ้างขึ้นอยู่กับโมเดลเสียงที่มนุษย์รับรู้ (psychoacoustic model) ที่อยู่ในโปรแกรมเข้ารหัสเสียงครับ (Encoder) แล้วจะตัดเยอะแค่ไหนขึ้นอยู่กับ bit rate ที่ใช้ ยิ่งใช้ค่าสูง ก็จะตัดข้อมูลน้อย ไฟล์ยิ่งใหญ่ เสียงยิ่งดีครับ ที่นี้จึงเป็นปัญหาของเราว่าควรจะใช้ bit rate เท่าไหร่ดี อ่านไปเรื่อยๆ ครับผมจะอธิบายให้ฟัง ส่วนรูปแบบไฟล์ที่เป็น Lossy ก็เช่น mp3, mp2, ogg, wma, aac ครับ
ข้อควรจำนะครับ ด้วยความที่ lossy มีการตัดข้อมูลออกมาบ้างระหว่างการแปลงไฟล์ เราจึงควรหลีกเลี่ยงการนำไฟล์ lossy มาแปลงไฟล์ซ้ำๆ ครับ เช่นเอา mp3 ที่ 128 kbps มาแปลงเป็น ogg ที่ 160 kbps เสียงที่ได้ก็จะแย่กว่า mp3 ด้วยซ้ำ เพราะข้อมูลเรามีอยู่เท่านี้ แต่เราไปแปลงมันอีก ให้มันตัดทอนข้อมูลลงไปอีกครับ รวมถึงการแปลงจาก lossy ไปยัง lossless ด้วยนะครับ อย่าง mp3 -> flac ขนาดไฟล์จะใหญ่ขึ้นมาก แต่คุณภาพก็เท่ากับ mp3 นั้นแหละครับ เออ การเซฟเป็นไฟล์แบบ lossy ซ้ำๆ ก็ทำให้เสียคุณภาพได้ด้วยนะครับ อย่างเราเปิดไฟล์ mp3 ขึ้นมาตัดต่อ แล้วเซฟทับลงไปในไฟล์เดิม ยิ่งเซฟทับบ่อยครั้งเท่าไหร่ คุณภาพไฟล์ก็จะเสียไปเยอะเท่านั้นครับ
สรุปนะครับ ถ้าต้องการเสียงดีๆ หรือเก็บไฟล์ระดับที่เทียบเท่าต้นฉบับ แบบว่าถ้าแผ่นต้นฉบับพังแล้วเอาไฟล์นี้ไปไรท์ใหม่ จะได้คุณภาพเท่าเดิมเลย ให้ใช้ไฟล์แบบ lossless ครับ แต่ถ้าพื้นที่น้อย แล้วลองฟังดูแล้ว แยกความแตกต่างระหว่างเสียงจาก Lossless และ Lossy ไม่ได้ ก็บีบเป็นพวก Lossy ก็ได้ครับ

ภาพจาก spectrum analyzer เพลงเดียวกันนะครับ คู่บนคือไฟล์ที่บีบด้วย FLAC ซึ่งเป็น lossless ส่วนคู่ล่างเป็นไฟล์ที่บีบเป็น mp3 ด้วย LAME ระดับ V5 (ราวๆ 130 kbps) ซึ่งเป็นแบบ lossy นะครับ สังเกตดีๆ ครับ ส่วนบนของกราฟคู่บนจะอยู่ครบ แต่ในคู่ล่างส่วนนี้จะถูกตัดออกไป เห็นเรียบเตียนไปเลย ซึ่งก็คือเสียงที่ความถี่สูงๆ ถูกตัดออกไปนั่นเองครับ



ลักษณะของการใช้ Bit-rate

จบเรื่องประเภทไปก็มาเข้าเรื่องลักษณะของการใช้ bit rate กันต่อเลยครับ คุณผู้อ่านเคยสังเกตเห็นไฟล์ mp3 ที่เวลาเราเล่นแล้วตัวเลขตรง kbps มันเปลี่ยนไปเปลี่ยนมารึปล่าวครับ ไม่ได้แสดงคงที่ที่ 128 kbps ตลอดเวลา ถ้าคุณเคยเห็นก็แปลว่ากำลังเห็นผี mp3 ตามหลอกหลอนนนคุณอยู่... แหะๆ ไม่ใช่ครับมันเป็น mp3 ที่ใช้ bit rate แบบ VBR หรือ ABR ครับ
ลักษณะของการใช้ Bit rate จะมีสามแบบคือ CBR, VBR, ABR ซึ่งแตกต่างกันดังนี้
CBR (constant bitrate) เป็นการใช้ bit rate ที่พื้นฐานที่สุด ซับซ้อนน้อยที่สุด ให้คุณภาพแย่ที่สุด แต่เราเห็นใช้กันมากที่สุด CBR คือใช้ bit rate คงที่ ไม่ว่าเสียงตอนนั้นจะซับซ้อน หรือไม่มีเสียงอะไร bit rate ก็จะยังค้างอยู่ค่านั้น ไม่ยืดหยุ่นใดๆ เช่นค้างอยู่ที่ 128 kbps ตลอดเวลา ข้อดีของมันคือ เราคำนวณขนาดไฟล์ได้ก่อนที่จะแปลงไฟล์ และเหมาะสมสำหรับทำ streaming แบบที่ห้ามใช้ bit rate เกินจากที่กำหนด
ABR (average bitrate) อยู่ตรงกลางระหว่าง CBR กับ VBR ครับ ลักษณะของ ABR คือ bit rate จะขึ้นๆ ลงๆ ได้ตามความซับซ้อนของเสียงในขณะนั้น แต่จะให้ผู้ใช้ระบุค่าได้ว่าจะให้ bit rate อยู่ราวๆ ไหน เช่นป้อนไปที่ 128 kbps ระดับของ bit rate จะขึ้นๆ ลงๆ อยู่ประมาณ 128 kbps ครับ
VBR (variable bitrate) เป็นการใช้ bit rate ที่ให้ประสิทธิภาพสูงที่สุด เป้าหมายของ VBR จะต่างจาก ABR และ CBR ครับ คือ VBR จะพยายามคงระดับคุณภาพของเสียงให้คงที่ตลอดเพลง ด้วย bit rate ที่ต่ำที่สุดเท่าที่จะเป็นไปได้คือดูจากคุณภาพเสียงเป็นหลัก เช่นช่วงที่ไม่มีเสียง มันก็ใช้ bit rate ที่ต่ำที่สุดเลยคือ 32 kbps ต่างจากอีก 2 อย่างที่เหลือที่จะพยายามคง bit rate ตามที่กำหนดเอาไว้ ส่วนคุณภาพเสียงจะแกว่งๆ ไม่เท่ากันทั้งเพลง ข้อเสียของ VBR ก็ตรงข้ามกับ CBR ครับ คือเราไม่สามารถคำนวณขนาดไฟล์ที่จะได้ เพราะ bit rate ที่ใช้มันจะเปลี่ยนไปเรื่อยๆ และเรื่อง streaming ที่เราคุม bit rate ไม่ได้ครับ
สรุปนะครับ VBR จะให้เสียงคุณภาพดีที่สุด ABR อยู่ในระดับรองลงมา แล้ว CBR อยู่ท้ายสุด เพราะฉะนั้นเวลาจะใช้ก็ใช้เป็น VBR ดีกว่าครับ

การบีบอัดเสียงประเภทต่างๆ

MP3 (MPEG Audio Layer-3)
เป็นรูปแบบไฟล์ที่พวกเรารู้จักกันดีนะครับ เพราะเกิดขึ้นมานานแล้ว (เข้าสู่มาตรฐาน ISO เมื่อปี 1991) ถือเป็นรูปแบบไฟล์แบบ lossy ตัวแรกที่ได้รับความนิยมในวงกว้าง เพราะความสามารถในการบีบอัดที่สามารถลดข้อมูลได้กว่า 10 เท่า ในคุณภาพที่ยอมรับได้ ข้อดีของ mp3 คือเป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลาย หาเครื่องเล่นง่าย ทำให้มั่นใจว่าถ้าบีบอัดเป็น mp3 แล้วจะหาเครื่องเล่นได้แน่ๆ แต่ข้อเสียคือมีประสิทธิภาพน้อยกว่ารูปแบบไฟล์ใหม่ๆ เช่น ogg หรือ aac แล้วก็ยังไม่สามารถเก็บเสียงความละเอียดสูงเกินกว่า 48,000 Hz แถมยังใช้ Bit rate สูงสุดได้แค่ 320 kbps บางทีมันก็ไม่เพียงพอสำหรับระดับหูทองคำ เก็บเสียง multichannel ไม่ได้ แล้วยังมีปัญหาเรื่องสิทธิบัตรอันแสนจะวุ่นวายด้วยครับ
เรื่อง mp3 ที่ผมจะพูดถึงวันนี้จะอ้างอิงข้อมูลจาก LAME encoder นะครับ ซึ่ง LAME นี้ถือเป็นโปรแกรมแปลงไฟล์ MP3 ที่ดีที่สุดตัวหนึ่งในปัจจุบัน พัฒนากันมาตั้งแต่ปี 1998 จนปัจจุบันอยู่ที่รุ่น 3.97 ครับ LAME ถูกนำไปใช้ในโปรแกรมมากมาย เช่น Flash รวมถึงโปรแกรมแปลงเพลงต่างๆ ที่เราใช้กันอยู่อย่าง CDex, dBPowerAmp หรือ Winamp (Mp3Dev ก็คือ LAME ครับ) ที่สำคัญมันเป็น freeware ด้วยครับ

การทดลองคุณภาพของ mp3 ที่ได้จาก encoder ตัวต่างๆ คือ LAME 3.95, FhG จาก Adobe Audition, iTune 4.2 ครับ บีบอัดที่ 128 kbps จะเห็นว่า LAME ได้คะแนนสูงที่สุดครับ ถ้าอยากดูผลเต็มๆ ก็กดที่รูปได้ครับ


จากที่กล่าวไปข้างต้นว่าหากเรียงลำดับคุณภาพจากมากไปน้อยแล้วจะเป็นตามนี้ VBR > ABR > CBR เพราะฉะนั้นเวลาแปลง MP3 จึงควรใช้เป็น VBR ซึ่ง LAME จะใช้ค่า VBR เป็น V (แต่บางโปรแกรมใช้ Q ครับ) ต่างๆ ตั้งแต่ V0 ซึ่งมีคุณภาพสูงที่สุดจนถึง V9 ที่คุณภาพแย่ที่สุด แต่ว่าขนาดเล็กที่สุด สรุปเป็นตารางได้ดังนี้

ระดับ

Preset

Bit rate เป้าหมาย (kbps)

ช่วงของ bit rate

จะตัดเสียงตั้งแต่ความถี่นี้ขึ้นไป

Resample

V0

--preset fast extreme

240

220...260

19383 Hz - 19916 Hz


V1


210

200...250

18671 Hz - 19205 Hz


V2

--preset fast standard

190

170...210

18671 Hz - 19205 Hz


V3


175

155...195

17960 Hz - 18494 Hz


V4

--preset fast medium

165

145...185

17960 Hz - 18494 Hz


V5


130

110...150

16538 Hz - 17071 Hz


V6


115

95...135

15826 Hz - 16360 Hz


V7


100

80...120

14581 Hz - 14968 Hz

32000 Hz

V8


85

65...105

12516 Hz - 12903 Hz

32000 Hz

V9


65

45...85

9774 Hz - 10065 Hz

24000 Hz


จากตารางจะเห็นได้ว่านอกจากที่ V สูงๆ จะใช้ bit rate ที่ต่ำมาก จึงให้ขนาดไฟล์ที่เล็กแล้ว อย่าง V9 ที่ใช้ bit rate แค่ประมาณ 65 kbps แต่ว่าเสียงช่วงตั้งแต่ 9774 Hz ขึ้นไปจะถูกตัดทิ้ง แล้วเสียงยังถูกลดความละเอียดลงเหลือแค่ 24000 Hz ด้วย จึงไม่เหมาะกับเสียงดนตรีอย่างแรง
แล้ว bit rate ไหนที่ควรใช้ เราลองมาดูกราฟนี้กันครับ

จะเห็นได้ว่าตั้งแต่ V3 ขึ้นไป ระดับคุณภาพ (Quality) เพิ่มขึ้นไม่มาก แต่ขนาดไฟล์เพิ่มขึ้นอย่างต่อเนื่อง จนถึงระดับสูงสุดคือ CBR 320 kbps คุณภาพก็ไม่แตกต่างจาก V3 มากนัก เพราะฉะนั้นระดับที่ควรใช้จึงเป็นราวๆ V3 (ประมาณ 175 kbps) หรือ V2 (ประมาณ 190 kbps) ครับ ก็จะได้เสียงที่ดีจนแยกไม่ออกจากต้นฉบับเลย ถ้าสูงกว่านี้จะเป็นระดับที่ใช้เก็บรักษาต้นฉบับแล้วครับ เช่นระดับสูงสุดของ mp3 คือ CBR 320 kbps ซึ่งถ้าต้องการนำไปใช้ในงานแบบนี้ แนะนำให้ใช้เป็นไฟล์ lossless ไปเลยดีกว่าครับ แต่ถ้าต้องการขนาดที่เล็กกว่านี้ เช่นอยากเอาไปใส่ในเครื่องเล่น mp3 ที่มีความจุไม่มาก ก็แนะนำให้ใช้ราวๆ V5 ครับ
แล้วถ้าโปรแกรมของคุณให้เลือก preset ได้ อย่าง --preset fast medium ก็ไม่ต้องสงสัยไปครับ มันก็คือ VBR ระดับ V4 ที่ใช้ VBR new ด้วยนั้นเอง ไม่แตกต่างกันกับการสั่งด้วย V4 VBR new เลย สั่งได้เหมือนกันทั้งคู่ครับ แล้วที่นี้ VBR new คืออะไร มันคือตัวเลือกหนึ่งของ LAME ครับ ถ้าโปรแกรมของคุณมีให้เลือกใช้ VBR new ก็เลือกใช้ไปเลยครับ เพราะจะทำงานได้เร็วกว่า และคุณภาพสูงกว่า
ต่อมาถ้าโปรแกรมที่คุณใช้ให้เลือกประเภทของ Stereo ได้ว่าจะเป็น Stereo, Joint Stereo, Mono ให้เลือกเป็น Joint Stereo ครับ ประสิทธิภาพจะดีที่สุด คือจะทำให้ลดข้อมูลที่ต้องเก็บได้ แต่คุณภาพยังเป็นระดับ Stereo อยู่ เพราะว่า Joint Stereo จะใช้วิธีจัดการเสียง Stereo 3 แบบผสมกัน ให้เหมาะกับเสียงต่างๆ จึงทำให้ใช้ bit rate ได้คุ้มค่าที่สุดครับ แต่ถ้าโปรแกรมของคุณเลือกไม่ได้ มันก็มักจะตั้งให้เป็น Joint Stereo ให้อยู่แล้วครับ
สรุปนะครับ ถ้าโปรแกรมให้เลือก bit rate ต่ำสุด/สูงสุดสำหรับ VBR ได้ ต่ำสุดก็เลือกเป็น 32 kbps แล้วสูงสุดเป็น 320 kbps ครับ ที่นี้ถ้าต้องการเสียงที่ดี แต่ไม่ใช้พื้นที่เยอะโอเวอร์ ให้เลือกเป็น VBR V2 (ราวๆ 190 kbps) แล้วใช้ vbr new กับ Joint Stereo ครับ ถ้าต้องการขนาดพอดีๆ แล้วเสียงยังใช้ได้อยู่ ให้เลือกเป็น VBR V5 (ราวๆ 130 kbps) ใช้ vbr new กับ Joint Stereo เช่นกันครับ



Ogg Vorbis (.ogg)
รูปแบบไฟล์ชนิดนี้เป็นรูปแบบไฟล์โปรดของผมเลยครับ เพลงในเครื่องทุกเพลงที่ผม rip เองจะเป็นไฟล์นี้ครับ ข้อดีของไฟล์นี้คือมีประสิทธิภาพสูง ให้เสียงคุณภาพดีกว่า mp3 ใน bit rate ที่เท่ากัน สามารถรองรับ Sample rate ได้สูงสุดถึง 200,000 Hz ใช้ bit-rate ได้กว้างมาก เป็น multi channel ก็ได้ แล้วก็เป็นรูปแบบไฟล์ที่ฟรีอย่างแท้จริง ไม่มีการเรียกเก็บค่าลิขสิทธิ์หรือค่าสิทธิบัตรการใช้ไฟล์ใดๆ ทั้งสิ้น แต่ข้อเสียสำคัญของมันคือไม่แพร่หลายเท่า MP3 ครับ มีเพียงเครื่องเล่น MP3 บางยี่ห้อเท่านั้นที่เล่นไฟล์ชนิดนี้ได้ อืม iPod ก็เล่นได้นะครับ แต่ต้องใช้ Firmware พิเศษอีกตัวหนึ่งที่ชื่อว่า Rockbox
Ogg Vorbis เป็นชื่อรวมกันระหว่าง Ogg ซึ่งเป็น Container และ Vorbis ที่เป็นชื่อของตัวรหัสเสียง ถ้าเราเรียกเฉพาะเทคโนโลยีที่ใช้บีบอัดเสียงอย่างเดียวจะเรียกว่า Vorbis ครับ
ด้วยความที่ Ogg Vorbis เป็นไฟล์ที่ไม่มีค่าใช้สิทธิ์ จึงถูกนำไปใช้ในงานหลายๆ แบบ เช่นเอาไปใช้ในเกม อย่าง Doom3, GTA:SA, เกมตระกูล Unreal เป็นต้น เรียกได้ว่าแม้คนทั่วไปจะใช้ Vorbis ไม่เยอะเท่า mp3 แต่ Vorbis ก็เป็นรูปแบบไฟล์ที่สำคัญตัวหนึ่งบนโลกคอมพิวเตอร์ครับ
Ogg Vorbis รุ่นแรกออกมาในเดือนกรกฎาคม ปี 2002 โดย Xiph.Org Foundation ครับ หลังจากนั้นก็ได้พัฒนาเรื่อยมาจนมาถึงรุ่น 1.2.0 แต่รุ่นที่ผมจะแนะนำให้ใช้ไม่ใช่รุ่นนี้หรอกครับ เพราะ Xiph.Org ไม่ได้พัฒนาเพิ่มเติมในส่วนของประสิทธิภาพมานานแล้ว ความสามารถของรุ่นนี้จึงสู้รุ่น aoTuV (Aoyumi's Tuned Vorbis) ที่พัฒนาโดยชาวญี่ปุ่นชื่อ Aoyumi ไม่ได้ครับ ปัจจุบัน aoTuV อยู่ที่รุ่น Beta 5.5 ครับ ข้อมูลคราวนี้ของผมจึงอ้างอิงจาก aoTuV Beta 5 เป็นหลักครับ

จากที่ผมเคยพูดถึงเรื่อง CBR, VBR ไปแล้วนะครับ Vorbis ก็รู้เรื่องนี้ดี มันจึงไม่มีการบีบอัดแบบ CBR ให้เลือก มีแค่ ABR และ VBR ครับ ซึ่ง VBR ของ vorbis จะใช้ q แทนระดับคุณภาพของเสียงดังนี้ครับ

ตัวเลือก

Bit rate เป้าหมาย โดยประมาณ (kbps)

ช่วงของ bit rate (kbps)

-q -2

~32

~32 – ~64

-q -1

~48

~48 – ~64

-q 0

~64

~64–~80

-q 1

~80

~80 – ~96

-q 2

~96

~96 – ~112

-q 3

~112

~112 – ~128

-q 4

~128

~128 – ~160

-q 5

~160

~160 – ~192

-q 6

~192

~192 – ~224

-q 7

~224

~224 – ~256

-q 8

~256

~256 – ~320

-q 9

~320

~320 – ~500

-q 10

~500

~500 – ~1000

ตารางนี้เฉพาะ auTuV เท่านั้นนะครับ

แล้วค่าไหนที่ควรใช้บ้าง ค่าที่เหล่าผู้เชี่ยวชาญเรื่องเสียงจากเว็บ Hydrogen Audio แนะนำมีสองค่าครับ ถ้าต้องการไฟล์ขนาดเล็ก สำหรับเครื่องที่พื้นที่น้อยๆ หรือใส่ในเครื่องเล่นเพลง ที่ระดับ q 2 ก็เพียงพอสำหรับคนทั่วไปที่ไม่ต้องการความละเอียดเรื่องเสียงมากแล้วครับ ผมลองดูแล้วระดับนี้จะให้เสียงดีกว่า mp3 ที่ 128 kbps นิดหน่อยครับ แต่ถ้าต้องการไฟล์ที่มีคุณภาพใกล้เคียงกับ CD มากแบบแยกกันไม่ออก ก็แนะนำที่ระดับ q 5 ครับ ถ้าใครยังไม่สะใจก็เพิ่มขึ้นได้อีก แต่ q 5 คือขั้นต่ำที่สุดที่ยอมรับกันว่าเสียงใกล้เคียงกับ CD มากแล้วครับ แต่ก็ต้อง rip จาก CD จริงๆ นะครับ ไม่ใช่ไปแปลงไฟล์แบบ lossy ตัวอื่นมา
สรุปนะครับถ้าต้องการใช้ OGG ก็ให้ใช้รุ่น aoTuV beta5.5 ไปเลยครับ ผมทดลองรุ่นนี้มาพอสมควรแล้ว ทั้งเล่นบนคอมพิวเตอร์ และเครื่องเล่น mp3 ก็ไม่มีปัญหาใดๆ ส่วนการเลือกคุณภาพ ใช้ q 2 สำหรับงานที่ต้องการขนาดไฟล์เล็กๆ ครับ และ q 5 สำหรับงานที่ต้องการคุณภาพเทียบเท่า CD


AAC (Advanced Audio Coding) (.m4a , .aac , .mp4)

มาถึงเทคโนโลยีการบีบอัดไฟล์แบบที่ 3 กันแล้วนะครับ กับ AAC ผู้ร่วมพัฒนาเทคโนโลยีนี้คือผู้พัฒนา mp3 นั่นเอง ทำให้รูปแบบนี้มีความสามารถเหนือกว่า mp3 ครับ ปัจจุบันยังไม่แพร่หลายในวงกว้างเท่าไหร่ แต่รูปแบบนี้เป็นไฟล์มาตรฐานบน iTunes Store และ iTunes ก็แนะนำให้ใช้ AAC เวลา rip เพลง เทคโนโลยีนี้จึงใช้มากบน iPod ครับ ซึ่งมีผู้ใช้มากขึ้นเรื่อยๆ จนทำให้หลายค่ายเริ่มออกมารองรับไฟล์ชนิดนี้ อย่าง Sony เป็นต้น
ข้อดีของ AAC ที่เหนือกว่า mp3 ก็คือ รองรับ sample rate มากขึ้นเป็น 8,000 – 96,000 Hz แล้วยังรองรับได้ถึง 48 ช่องสัญญาณ ทำให้ทำ multichannel ได้ แล้วยังให้คุณภาพเสียงที่สูงกว่า mp3 ด้วยเทคนิคการบีบอัดแบบใหม่ๆ ครับ แต่ข้อเสียของมันอยู่ที่การที่มันมีรูปแบบภายในเยอะ เช่น LC, HE, SSR, LTP ฯลฯ ทำให้มีปัญหากับเครื่องเล่น บางเครื่องอาจจะเล่น HE-AAC ไม่ได้ แต่เล่น LC-AAC ได้ ซึ่งก็ต้องอ่านคู่มือดูนะครับ ว่าเครื่องคุณเล่นไฟล์อะไรได้บ้าง แล้วยังมีปัญหาเรื่องสิทธิบัตรยุ่งวุ่นวาย เพราะหลายบริษัท พัฒนาหลายเทคโนโลยี แล้วก็ถือสิทธิบัตรในเทคโนโลยีต่างๆ
AAC มี 2 แบบใหญ่ๆ ครับ คือ LC (Low Complexity) และ HE (High Efficiency) ความแตกต่างระหว่าง 2 ตัวอยู่ที่ LC จะมีความซับซ้อนน้อยกว่า จึงเหมาะกับไฟล์ที่ใช้ bit rate มากกว่า 80 kbps ครับ เพราะมี bit rate เยอะพอที่จะเก็บข้อมูลได้ดีพอ ไม่ต้องใช้กระบวนการพิเศษกับข้อมูล ทำให้ LC-AAC สามารถใช้กับเครื่องเล่นที่เล่น AAC ส่วนใหญ่ได้
แต่ HE นั้นจะใช้วิธีบีบอัดไฟล์แบบพิเศษ คือ Spectral band replication (SBR) ในการจัดการกับเสียงความถี่สูง แบบเดียวกับที่ใช้ใน mp3pro และ Parametric Stereo เพื่อจัดการเสียง stereo (จะมีใน HE-AAC รุ่นที่ 2 ครับ) แต่ 2 วิธีพิเศษนี้จะไม่เหมาะเมื่อใช้ bit rate สูงๆ เพราะว่าทั้งสองวิธีเป็นการโยนข้อมูลต้นฉบับทิ้งไปครับ แล้วใช้ความสามารถของคณิตศาสตร์ในการคำนวณข้อมูลที่สูญหายกลับขึ้นมา เพื่อให้ใช้ bit rate ต่ำลง แม้ว่ามันจะให้คุณภาพที่ดี แต่ยังสู้ของแท้ๆ จากต้นฉบับไม่ได้ เพราะฉะนั้นเมื่อมี bit rate มากพอ จึงไม่แนะนำให้ใช้ HE ครับ นอกจากนี้ยังมีเครื่องเล่นบางรุ่นเท่านั้นที่รองรับ HE-AAC การใช้งานจึงไม่กว้างเท่า LC-AAC รูปแบบของ HE จึงเหมาะกับไฟล์ที่ต้องใช้ bit-rate น้อยกว่า 80 kbps ครับ ซึ่งถ้าใช้ Nero AAC Encoder มันจะเลือกใช้ให้เราโดยอัตโนมัติ แต่ถ้าใช้ iTunes จะสร้างไฟล์แบบ HE ไม่ได้ แถม iPod ก็ยังเล่น HE-AAC ไม่ได้ครับ ช่างน่าเสียดายจริงๆ
ส่วนสารพัดเครื่องหมายการค้าของไฟล์ AAC นั้น เครื่องหมายที่หมายถึง HE-AAC มีดังนี้ครับ
aacPlus และ aacPlus v2 (HE-AAC รุ่นที่ 2) ของ Coding Technologies
Nero Digital ของ Nero
AAC+ ของ Nokia, Samsung และ Motorola แต่ถ้าเขียนว่า eAAC+ จะหมายถึง HE-AAC รุ่นที่ 2 ส่วน Motorola จะใช้ AAC+ Enhanced แทน HE-AAC รุ่นที่ 2 ครับ

นอกจากจะมีลักษณะภายในของไฟล์มากมาย และชื่อทางการค้ามากมายแล้ว AAC ยังใช้นามสกุลของไฟล์มากมาย เช่น
.mp4 ใช้ container ของ mp4 ซึ่งอาจจะเก็บทั้งภาพและเสียง หรือเสียงอย่างเดียวก็ได้ แต่ไฟล์ .mp4 ก็ไม่ใช่ AAC เสมอไป
. m4a ใช้ container ของ mp4 แต่เก็บเฉพาะเสียง
.m4p อันนี้เป็นไฟล์แบบ Protect ไว้ครับ
.m4b ไฟล์สำหรับ audiobook
.aac ไฟล์ที่ใช้โครงสร้างของ AAC เพียวๆ ไม่ได้ถูกห่อด้วย container ของ mp4

แต่ iPod จะไม่รองรับไฟล์นามสกุล .aac นะครับ เขียนมาถึงตรงนี้ผมก็ปวดหัวกับเจ้า AAC นี้ไม่น้อยเลย จนทำให้รู้สึกว่าโลกของธุรกิจจะทำให้ชีวิตพวกเรายุ่งยากขึ้น สร้างสารพัดเทคโนโลยีขึ้นมา แล้วดันไม่รองรับให้ทั้งหมด
แบบว่าเหนื่อยแล้ว ผมสรุปส่วนของการใช้งานเลยแล้วกันครับ ถ้าต้องการใช้ไฟล์ AAC นั้น ผมแนะนำ Encoder 2 ตัวคือ iTunes หรือไม่ก็ Nero AAC ครับ ทั้งสองตัวนี้ก็ใช้ฟรีทั้งคู่ ถ้าใครใช้ iPod ก็ใช้ iTunes ไปเถอะครับ จะได้ไม่มีปัญหาอะไร แต่ถ้าใครไม่อยากใช้ iTunes หรือใช้อุปกรณ์ค่ายอื่นก็ลองอ่านดูดีๆ ครับว่าอุปกรณ์ของท่านรองรับ AAC แบบไหนบ้าง ถ้ารองรับได้ถึง HE-AAC v2 ก็แนะนำ Nero AAC เต็มอัตราเลยครับ แต่ถ้ารองรับไม่ถึง ก็สามารถสั่ง nero ได้ ว่าเอาแค่มาตรฐานนี้ หรือไม่ก็ rip ให้มากกว่า 80 kbps ครับ จะได้ไฟล์ LC-AAC มาโดยอัตโนมัติ สำหรับค่าที่ควรใช้เวลา rip เพลงนะครับ ถ้าต้องการไฟล์เล็กๆ ก็ใช้ที่ประมาณ 128 kbps ถ้าต้องการคุณภาพสูงหน่อย ก็ใช้ประมาณ 160 kbps ครับ ถ้าเครื่องรองรับ HE-AAC ก็สามารถใช้ bit rate ที่ต่ำกว่านี้ได้ อย่าง 50-70 kbps ครับ


WMA (Windows Media Audio) (.wma)
มาถึงไฟล์ชนิดสุดท้ายในรูปแบบของ Lossy ที่ผมจะเขียนถึงซะทีนะครับ กว่าผมจะเขียนมาถึงตรงนี้ก็ใช้เวลาหลายวันอยู่ แล้วก็คงใช้เวลาอีกหลายวันกว่าบทความจะเสร็จ เอาน่า สู้ตายเก็บเงินซื้อลำโพง
หลายคนอาจจะคิดว่า WMA ก็น่าจะมีอย่างเดียวนิน่า เพราะเราก็เห็น WMA มาตั้งแต่ไหนแต่ไรแล้ว แต่จริงๆ แล้ว WMA แยกย่อยเป็น 4 เทคโนโลยีดังนี้ครับ
Windows Media Audio (WMA)
เป็นรูปแบบไฟล์ WMA ดั้งเดิมที่พวกเรารู้จักกันครับ สามารถเล่นกับเครื่องเล่นที่รองรับ WMA ได้มากที่สุด แต่ประสิทธิภาพนั้นเท่าๆ กับ mp3 แต่ mp3 (โดยเฉพาะ LAME รุ่นล่าสุด) จะทำได้ดีกว่าใน bit rate ที่มากกว่า 128 kbps รุ่นล่าสุดคือ 9.2 ที่มากับ Windows media player 11
WMA รองรับ sample rate สูงสุดที่ 48,000 Hz ครับ แล้วเพิ่งใช้ VBR ได้ในรุ่น 9 นี้เอง ผมจึงไม่แนะนำให้ใช้ WMA แบบนี้ เพราะประสิทธิภาพไม่ดีเท่าไหร่ แถมการใช้งานยังไม่กว้างเท่า mp3 ด้วยครับ

Windows Media Audio Professional (WMA pro)
เป็นรูปแบบที่พัฒนาขึ้นมาใหม่ครับ ไม่รองรับกับมาตรฐาน WMA เดิม เริ่มมีพร้อมกับ Windows media player 9 ปัจจุบันเป็นรุ่น WMA 10 pro ข้อดีของรูปแบบนี้ให้ประสิทธิภาพที่ดีกว่า WMA มาก ในทุกด้าน ทั้งที่ bit rate สูงและต่ำ แล้วยังรองรับ sample rate ได้ถึง 96,000 Hz ที่ 24 bit แล้วยังทำได้ถึง 8 ช่องสัญญาณ (7.1 channel) ความสามารถของ WMA pro จึงสามารถเทียบชั้นกับ Vorbis, AAC ได้ และเหนือกว่า mp3 ครับ
แต่ข้อเสียของ WMA pro นี้คือการที่ไม่รองรับกับมาตรฐาน WMA เดิม ทำให้อุปกรณ์ที่เคยเล่น WMA เดิมได้ไม่สามารถเล่น WMA pro นี้ได้ จึงมีอุปกรณ์ไม่กี่ชนิดที่รองรับ เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี windows media player 10 เป็นต้น

Windows Media Audio Lossless (WMA lossless)
รูปแบบนี้ก็เพิ่งมาใหม่ใน Windows media player 9 ครับ เป็นรูปแบบไฟล์ที่จัดเก็บแบบไม่มีการสูญเสียข้อมูลใดๆ ครับ ความสามารถก็จัดอยู่ในระดับที่ดี แต่ก็ยังมีอุปกรณ์ที่รองรับน้อยอยู่ อุปกรณ์ที่รองรับก็เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี Windows media player 10 หรือ Zune 2 ครับ

Windows Media Audio Voice (WMA voice)
เป็นรูปแบบที่ออกแบบมาเพื่อจัดเก็บเสียงพูดโดยเฉพาะครับ ใช้ bit rate ต่ำมาก แต่คุณภาพเสียงพูดยังใช้ได้อยู่ ทำงานโดยการตัดความถี่ที่ไม่เกี่ยวกับเสียงพูดทิ้งทั้งหมด ทำให้มีพื้นที่เก็บข้อมูลในส่วนของเสียงพูดมาก รูปแบบนี้รองรับ sample rate แค่ 22,050 Hz เป็นเสียง mono อย่างเดียว แล้วก็ใช้ bit rate สูงสุดแค่ 20 kbps ครับ ไม่แนะนำให้ใช้กับงานอย่างอื่นนอกจะเสียงพูดครับ อุปกรณ์ที่รองรับก็ยังเป็นโทรศัพท์มือถือที่ใช้ Windows mobile เหมือนเดิมครับ คู่แข่งของ WMA voice ก็คือ speex รูปแบบบีบอัดเสียงพูดฟรีๆ จาก xiph.org ครับ

ซึ่งทั้งหมดนี้สามารถสร้างได้จาก Windows media player รุ่น 10 ขึ้นไปครับ

สรุปเจ้า WMA นะครับ ผมไม่แนะนำให้ใช้ WMA ครับ ใช้ mp3 ดีกว่า ยกเว้นว่าถ้าเครื่องของคุณรองรับ WMA pro ก็ใช้เป็น WMA pro ก็ได้ครับ ใช้ที่ bit rate ราวๆ 128 kbps หรือ 160 kbps ก็ให้เสียงโอเคแล้วครับ


เปรียบเทียบประสิทธิภาพของ lossy codec

มาถึงตรงนี้ผมได้แนะนำรูปแบบการบีบอัดเสียงแบบ lossy ไป 4 รูปแบบสำคัญๆ แล้วนะครับ เพื่อให้การตัดสินใจง่ายขึ้น ผมจะนำเอาผลการทดสอบจากเว็บต่างๆ มาให้ดูกันนะครับ เออ เวลาอ่านกราฟให้ดูสเกลด้วยนะครับ อย่าให้ระยะห่างของจุดมันหลอก เพราะบางที่กราฟจะถูกขยายให้เห็นชัดครับ แต่จริงๆ แล้วมันไม่ได้แตกต่างกันขนาดนั้น

ภาพแรกนี้เป็นการทดสอบคุณภาพเสียงที่ bit rate 48 kbps เมื่อเดือนพฤศจิกายน 2006 ครับ จะเห็นได้ว่า HE-AAC อยู่อันดับที่ 1 แล้ว aoTuV beta 5 กับ WMA pro 10 ตามมา ส่วน WMA 9.2 นั้นอยู่รั้งท้ายอย่างเทียบไม่ติดครับ แต่ bit rate แค่นี้ผมก็ไม่แนะนำให้ใช้ทั่วๆ ไปนะครับ ยกเว้นถ้ามีพื้นที่น้อยจริงๆ อ่านข้อมูลการทดสอบเต็มๆ กดที่รูปครับ



ต่อมาเป็นการทดสอบคุณภาพเสียงที่ bit rate 64 kbps เมื่อเดือนกรกฎาคม 2007 ครับ จะเห็นได้ว่า rating จะสูงกว่าเมื่อ 48 kbps นิดหน่อยนะครับ


การทดสอบที่ bit rate 96 kbps เมื่อเดือนสิงหาคมปี 2005 WMA ได้อันดับสุดท้ายเลย


ที่นี้ดูที่ 128 kbps ทดสอบเมื่อเดือนธันวาคม 2005 บ้างครับ จะเห็นว่าถ้าเอา mp3 (โดย LAME) ไปเทียบกับรูปแบบใหม่ๆ ประสิทธิภาพจะด้อยกว่าครับ แต่ไม่มากเท่าไหร่

ผมคงแนะนำเป็นตัวอย่างเท่านี้นะครับ ถ้าสนใจอ่านเพิ่มเติมก็ลองอ่านดูที่ http://www.soundexpert.info/index.htm และ http://en.wikipedia.org/wiki/Codec_listening_test ครับ แต่เวลาอ่านการทดสอบก็ต้องดูรุ่นของ Encoder ที่เข้าร่วมการทดสอบ รวมถึงวันที่ทดสอบด้วยนะครับ ว่าใกล้เคียงกับที่เรากำลังใช้อยู่รึปล่าว


สรุปส่วนของ Lossy
ถ้าใช้บนคอมพิวเตอร์อย่างเดียว แนะนำให้ rip เป็น Vorbis aoTuV beta 5.5 หรือ LC-AAC หรือ WMA pro แล้วแต่สะดวกครับ (แต่ผมชอบ Vorbis มากที่สุดนะครับ) เลือกให้เป็นแบบ VBR ส่วน bit rate ก็ใช้ตามที่แนะนำไปในแต่ล่ะรูปแบบไฟล์ครับ
ถ้าใช้บนเครื่องเล่นแบบพกพาด้วย ก็เลือกรูปแบบที่ดีกว่า mp3 เครื่องเล่นนั้นเล่นได้ เช่นถ้าเครื่องเล่น vorbis และ mp3 ได้ ก็แนะนำให้ใช้ vorbis ก่อนครับ หรืออย่าง iPod ก็แนะนำให้ rip เป็น AAC จะดีกว่า แต่ถ้าเครื่องนั้นเล่นได้เฉพาะ mp3 และ wma ธรรมดา (ไม่ใช่รุ่น pro) ก็แนะนำให้ rip เป็น mp3 จะดีกว่าเป็น wma ครับ ส่วน bit rate ก็ตามที่แนะนำในรูปแบบไฟล์ต่างๆ ครับ
แต่ถ้าต้องการไฟล์ที่แน่ใจว่าเล่นได้กับทุกเครื่อง ก็ต้องเป็น mp3 ครับ ปรับตามที่แนะนำนะครับ จะได้ mp3 ที่ดีที่สุด
แล้วถ้าอยากได้เสียงที่เฉียบขาด สมบูรณ์ที่สุด ก็ต้องนี้เลยครับ ไฟล์รูปแบบ Lossless ซึ่งผมจะแนะนำในบทความต่อไปครับ เพราะ Blogger มันไม่รับซะแล้ว

อย่าลืม comment นะครับ ไม่งั้นงอนไม่เอาบทความมาลงอีกจริงๆ ด้วย

ป้ายกำกับ:

16 ความคิดเห็น:

เวลา 06 เมษายน, 2551 20:29 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

ขอบคุณสำหรับข้อมูลความรู้ดีๆครับ

และขอถามเพิ่มเติมครับ

WMA Pro

กับ

WMA VBR

ไฟล์ไหนมีคุณภาพมากกว่ากันครับ

 
เวลา 07 เมษายน, 2551 13:52 , Blogger Eka-X กล่าวว่า...

อืม ถ้าตั้งเป็น VBR เหมือนกัน ที่ bit-rate เท่ากัน WMA pro เหนือกว่าแน่ๆ ครับ
แล้วแม้จะ WMA pro จะใช้เป็น CBR แต่ถ้าเทียบกับ WMA VBR ที่ bit-rate ใกล้เคียงกัน WMA pro ก็ยังเหนือกว่าอยู่ดีครับ

 
เวลา 07 เมษายน, 2551 15:52 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

แล้วถ้า VBR Bit rate ที่ 300-344

และ WMA Pro Bit Rate ที่ 192

อันไหนจะแจ่มกว่ากันครับ

 
เวลา 08 เมษายน, 2551 14:55 , Blogger Eka-X กล่าวว่า...

แบบนี้อาจจะแยกไม่ออกแล้วครับ อาจะต้องวัดด้วย spectum แต่ที่แน่ๆ คือ WMA VBR ขนาดไฟล์ใหญ่กว่ามาก
ปล. กรณีนี้ใช้เป็น mp3 ไปเลยดีกว่า

 
เวลา 10 เมษายน, 2551 05:15 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

จากข้างบน ที่เกียวกับ AAC

ทำไม iPod ผมเล่้น AAC-HE ได้ล่ะ
ปกติ rip กับ Winamp ก็เลือก
mode: MP4-aacPlus (HE-AAC) High Bitrate Encoder v1.27
bitrate: 256
channel mode: stereo

มันจะออกมาได้ .m4a มันก็เล่นบน Ipod ได้นิครับ
หน้าจะมีเรื่อง Replay Gain ด้วยน่ะครับ

 
เวลา 10 เมษายน, 2551 13:00 , Blogger Eka-X กล่าวว่า...

ผมไม่แน่ใจนักเรื่อง ipod นะครับ เพราะไม่มีไว้ใช้ส่วนตัว ใน firmware รุ่นใหม่ๆ อาจจะปรับปรุงให้ใช้ HE-AAC ได้แล้วก็ได้นะครับ หรืออาจจะเกี่ยวกับ header ของ m4a

ส่วนเรื่อง replayGain เขียนไว้อย่างละเอียดในบทความ foobar2000 ที่รอลงนิตยสาร PCtoday ครับ

 
เวลา 04 มกราคม, 2552 15:27 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

ผิดพลาดอย่างสำคัญเลย เกี่ยวกับคุณภาพเสียงของ CBR กับ VBR
คุณลอง rip ซีดีเพลงดูทั้ง 2 แบบ แล้วลองใช้ Nero Wave Editor แสดงกราฟเสียงดูครับ แล้วจะรู้
VBR ดีกว่า CBR อยู่เรื่องเดียวเท่านั้นคือใช้พื้นที่น้อยกว่า (ไฟล์เล็กกว่า)

 
เวลา 25 สิงหาคม, 2552 17:18 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

ขอบคุณสำหรับข้อมูลดีๆที่เอามาฝากครับ

 
เวลา 27 มกราคม, 2553 09:07 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

ถ้าเราใช้ตัว Decoder ต่างกัน
เสียงที่ออกมามันจะต่างกันใช่มั้ยครับ
ปกติผมใช้ LibMad เป็นตัว Decoder
ให้กับไฟล์ mp3 น่ะครับ รู้สึกว่ามัน
ให้เสียงความถี่สูงออกมาได้พอดีกับย่านเสียงความถี่ต่ำเลยครับ
ต่างจากตัวDecoderตัวอื่นที่แทบไม่ได้ยินเสียงย่านความถี่สูงเลยอ่ะครับ

 
เวลา 18 กุมภาพันธ์, 2553 00:18 , Blogger zAw กล่าวว่า...

สุดยอดครับ ปวดหัวกับไฟล์ต่างๆจริงๆ หาบทความอย่างนี้มานานแล้วครับ

 
เวลา 16 เมษายน, 2553 02:09 , Anonymous ไม่ระบุชื่อ กล่าวว่า...

ขอบคุณสำหรับข้อมูลครับ

อ่านแล้ว ได้ความรู้เพิ่ม

 
เวลา 17 มิถุนายน, 2553 22:35 , Blogger Unknown กล่าวว่า...

สวัสดีครับท่านกูรู ทั้งหลาย พอดีผมมีงานที่อาจารย์สั่งมา ผม งง มากมายอยากได้คำอธิบายจากผู้รู้ครับผม
คำถามบอกว่า จงอธิบายพร้อมแสดงภาพประกอบ
1.track คืออะไร
2.mono track
3.stereo track
4.stereo4 track
5.multi-tracks เช่น 16tracks 32tracks 64tracks เป็นต้น
ขอบคุณมากนะครับท่านกูรู ที่ให้คำแนะนำ และความหมายนะครับ

 
เวลา 12 มีนาคม, 2556 14:22 , Blogger Unknown กล่าวว่า...

ผมใช้ nero เป็นตัวบันทึกเสียง และใช้ adobe audition เป็นตัวตัดต่อ แต่งเสียง พอ export ออกมาเป็น mp3 ส่งสถานีวิทยุ ปรากฏว่าทางสถานีเล่นไฟล์ไม่ได้ มีปัญหาเล่นไปได้หน่อยก็วกกลับมาที่เดิม ....ปัญหาคืออะไรครับ?

 
เวลา 19 กรกฎาคม, 2556 18:39 , Blogger baka_jr กล่าวว่า...

ขอบคุณมากๆครับ สำหรับความรู้ดีๆ มันมีประโยชน์มากจริงๆครับ

 
เวลา 12 ตุลาคม, 2557 00:03 , Blogger 도우도우 กล่าวว่า...

ขอบคุณค่ะ ได้ความรู้มาอีกนิดแล้ว

 
เวลา 20 กรกฎาคม, 2559 21:22 , Blogger Unknown กล่าวว่า...

ขอบคุณมากๆสำหรับความรู้ดีๆครับผม...

 

แสดงความคิดเห็น

สมัครสมาชิก ส่งความคิดเห็น [Atom]

<< หน้าแรก