24 เมษายน 2551

เรื่องลิขสิทธ์ในบ้านเรา

ก่อนจะเริ่มคุยกันเรื่องนี้ผมขอออกตัวไว้ก่อนเลยนะครับ ว่าผมก็เป็นคนธรรมดาคนหนึ่ง ไม่ได้ร้ำรวยมาจากไหน ใช้ของเถื่อนบ้าง แต่ก็ยังซื้อของแท้อยู่เรื่อยๆ เพราะอยากช่วยผู้ผลิตจริงๆ

สถานการณ์เรื่อง ลิขสิทธิ์โดยเฉพาะในวงการเพลงบ้านเราแย่ลงทุกวันๆ ครับ เรียกได้ว่าถ้าขายแผ่นอย่างเดียว ศิลปินแทบอยู่กันไม่ได้ ต้องอาศัยงานอื่นๆ เช่นการโชว์ตัว หรือเล่นคอนเสริตเข้าช่วย อย่างที่ผมเคยอ่านมาจาก pantip มีประโยคหนึ่งมันแทงใจผมมากๆ เลย คือคนเล่าเรื่องนี้เขาเป็นคนขายแผ่นซีดีแท้ครับ แล้ววันหนึ่งก็มีลูกค้าเข้าร้านมาสั่งว่า "พี่เอาพี่ตูนแผ่นหนึ่ง แล้วแผ่นเปล่า 10 แผ่น" อื้ม... มันเอาแผ่นเปล่าไปทำอะไรหว่า

ทำไม คนไทยกับลิขสิทธิ์มันถึงไปด้วยกันไม่ได้ซะที ผมนอนคิด กลิ้งคิด เอาหัวกระแทกหน้าต่างรถเมล์ตอนจะหลับคิด แล้วก็พอจะเห็นได้หลายประการอยู่
  1. คนไทยไม่ค่อยได้คิดสร้างสรรค์อะไร ผมมองในภาพรวมๆ นะครับ จากประสบการณ์ของผมและคนที่ผ่านเข้ามา คิดดูตอนที่เราเรียนหนังสืออยู่เราคิดอะไรขึ้นมาเองจริงจังบ้าง เช่น project, โครงงาน ฯลฯ ก็แทบจะไม่มีครับ ส่วนใหญ่ก็เอาที่เค้าทำๆ มากันทั้งนั้น หรือเอาแค่ดัดแปลงให้กลายเป็นงานในชื่อของเราได้ เช่นปรับปรุงของเดิมให้ดีกว่าเดิมมากพอที่จะใส่ชื่อเราลงไปเป็นผู้สร้าง สรรค์ต่ออย่างหน้าไม่อาย ก็หาได้ยากครับ แล้วถ้าเด็กๆ ของประเทศไทยเป็นแบบนี้ พวกเขาจะเข้าใจความยากลำบากของการสร้างความคิดสร้างสรรค์ได้อย่างไร พวกเขาก็จะหาแต่ของที่ง่ายๆ ทำอะไรก็ทำง่ายๆ ก็อปก็ก็อปง่ายๆ เพราะมันฝังหัวมาแล้วว่างานแบบนี้ฉันก็เคยทำ ไม่เห็นเหนื่อยอะไร (ก็แน่ล่ะ ไม่ได้คิดเองนิ)
  2. คนไทยต่อต้านการก็อปปี้แบบแปลกๆ ถ้าใครเข้าเว็บ pantip เรื่อยๆ จะเห็นกระทู้ในลักษณะ "เพลงนี้ก็อปเพลงนี้มารึเปล่า" ครับ ซึ่งส่วนตัวผมแล้ว มันมองได้ 2 แง่เหมือนกันนะ อย่างแรกถ้าก็อปแบบโคดเหมือน เพลงยาว 4 นาที เหมือนซะ 2-3 นาที อันนี้ก็ไม่ไหว เค้าเรียกว่าก๊อปปี้จริงๆ แต่อีกอย่างที่ผมให้มองแล้วลองคิดดูคือ ถ้าเป็นในลักษณะของแรงบันดาลใจล่ะ แบบทั้งเพลงเหมือนแค่ท่อนเดียว หรือแค่คล้ายๆ กัน อันนี้ไม่น่าจะเรียกว่าก็อปปี้นะครับ
  • ผมอยากจะให้มองแบบนี้ครับ มีอะไรบ้างในโลกมนุษย์ที่มนุษย์คิดขึ้นมาเอง โดยไม่มีแรงบันดาลใจจากธรรมชาติ หรืออะไรเลย ตอนนี้ผมก็คิดไม่ออกว่ามีอะไรบ้าง ผมก็มั่วๆ ไปว่าอาจจะมีแต่น้อยมาก (ภาพ Abstract ยังได้แรงบันดาลใจจากอารมณ์มนุษย์ ที่หลายๆ ครั้งก็ไม่ใช่อารมณ์ตัวเองเลย) แล้วเวลาคุณเรียนรู้เนี่ย โดยเฉพาะในวัยเด็กเลย คุณรียนรู้อย่างไร ถ้าไม่ใช่เลียนแบบมา เช่น เลียนแบบท่าทางการเดิน เลียนแบบการพูด เพราะฉะนั้นผมจึงมองว่าแรงบันดาลใจกับการเลียนแบบเนี่ย มันไม่ใช่เรื่องผิดอะไรเลย ถ้าใช้อย่างเหมาะสม
  • แต่คนไทยกลับรู้สึก ไม่ดีอย่างรุนแรงถ้ารู้ว่าเพลงที่ฟังมันเหมือนเพลงที่เคยได้ยินมา แม้ว่าจะเป็นแค่ท่อนเดียว แล้วก็จะพยายามทำลาย ต่อต้าน
ลองให้ โอกาสกันบ้างนะครับ อย่าเพิ่งไปต่อต้านอะไรมากเลย รอดูไปก่อนว่ามีพัฒนาการบ้างรึปล่าว ถ้ามีพัฒนาการ แล้วไม่โดนตัดกำลังไป เมืองไทยจะได้มีอะไรเก่งๆ ขึ้นอีก ก่อนจบประเด็นนี้ผมขอยกตัวอย่างอีกเรื่องหนึ่งเกี่ยวกับการลอกเลียนแบบและ พัฒนาครับ บางคนอาจจะไม่รู้นะครับว่าญี่ปุ่นและเกาหลีใต้ ก่อนที่จะเป็นผู้นำด้านเทคโนโลยีแห่งหนึ่งของโลกเนี่ย เค้าเริ่มจากการลอกเลียนและพัฒนามาก่อน อย่างญี่ปุ่นนำเอากล้องจากยุโรปมาเลียนแบบก่อน ตอนแรกทำแบบเหมือนเลยนะครับ แล้วค่อยๆ พัฒนาปรับปรุงกล้องของตัวเองขึ้นมา จนตอนนี้เป็นไงล่ะครับ มีอีกซักกี่ % ของโลกที่ใช้กล้องยุโรป หรืออีกเรื่องหนึ่งคือมอเตอร์ไซค์ที่ญี่ปุ่นก็เลียนแบบมาเหมือนกัน เรื่องนี้ถ้าเป็นเมืองไทย พอเริ่มเลียนแบบปุ๊บ ผมว่าโดนกระแสกดดัน อะไรต่างๆ นาๆ จนเลิกไป แน่ๆ เลย

วันนี้ก็ขอพักแค่นี้ก่อนครับ เพราะห้องเน็ตปิดแล้ว (ชีวิตผูกไว้กับห้องเน็ต) ไว้จะมาต่อความคิดเห็นที่เหลือครับ อย่างผมคิดว่าบางทีคนไทยก็ไม่เข้าใจการกระจายรายได้ ฯลฯ ถ้าใครคิดเห็นยังไง มาร่วมพูดคุยกันได้นะครับ

06 เมษายน 2551

สารพันรูปแบบไฟล์เพลง ภาค Lossless พร้อมที่โหลด Encoder

การบีบอัดแบบ Lossless
ผมเขียนมาถึงตรงนี้แล้วรู้สึกว่าบทความนี้มันยาวจังเลย คุณผู้อ่านจะยังอยู่กับผมถึงตรงนี้รึปล่าวนะ แล้วทั่น บก. จะหั่นบทความผมไปเยอะรึปล่าวก็ไม่รู้ 555 ทำตัวไม่สนใจแล้วเล่าเรื่องต่อ เรามาถึงส่วนของ Lossless แล้วครับ เป็นส่วนของผู้รักเสียงเพลงอย่างแท้จริง ในส่วนนี้ผมจะไม่พูดถึงคุณภาพเสียงของรูปแบบต่างๆ นะครับ เพราะแบบ Lossless จะให้คุณภาพเสียงเหมือนต้นฉบับในทุกรูปแบบไฟล์ต่างๆ แต่จุดที่ทำให้แต่ละรูปแบบแตกต่างกันจะอยู่ที่ความสามารถในการบีบอัด และการรองรับจากอุปกรณ์และโปรแกรมต่างๆ งั้นเราไปเริ่มกันเลยดีกว่าครับ
FLAC (Free Lossless Audio Codec) (.flac)
เป็นรูปแบบของ Lossless ที่ได้รับความนิยมสูงที่สุดตัวหนึ่งครับ ด้วยความที่เป็นรูปแบบฟรี ไม่มีค่าใช้สิทธิ์ใดๆ แล้วยังเป็น open source อีกด้วย ในต่างประเทศ FLAC จึงได้รับความนิยมค่อนข้างสูง ข้อดีของมันนอกจากที่ฟรีแล้ว ยังทำงานได้รวดเร็ว แล้วก็มีโปรแกรมและอุปกรณ์รองรับมากมาย เช่น Winamp รุ่น 5.5 ก็สามารถเปิด FLAC และ rip เพลงเป็น FLAC ได้โดยไม่ต้องติดตั้งอะไรเพิ่ม หรือ iPod ก็รองรับ แต่จะต้องใช้ fireware พิเศษที่ชื่อว่า rockbox (ตัวเดียวกับที่ทำให้รองรับ ogg Vorbis) ก็จะเล่นไฟล์ชนิดนี้ได้ แต่ข้อเสียของ FLAC ก็อยู่ที่ความสามารถในการบีบอัดเพลงน้อยกว่ารูปแบบอื่นๆ อย่าง monkey’s audio อยู่บ้าง แต่ก็ไม่มากนัก
FLAC รองรับ sample rate ตั้งแต่ 1 Hz ถึง 1048.57 kHz ครับ bit depth ก็ใช้ได้ถึง 32 bit ครับ ปัจจุบัน FLAC อยู่ที่รุ่น 1.2.1 แล้วก็ถือเป็นหนึ่งในรูปแบบของ xiph.org ไปแล้ว บางทีจึงอยู่ใน container OGG ได้

WavPack (.wv)
เป็นรูปแบบฟรีคล้ายๆ กับ FLAC นะครับ แต่เด่นกว่าตรงที่สามารถทำไฟล์แบบ Hybrid/lossy ได้ ก็คือมันสามารถสร้างไฟล์แบบ lossy ได้ พร้อมกับไฟล์อีก 1 ไฟล์ที่เรียกว่า correction file เราสามารถนำไฟล์แบบ lossy ที่มันสร้างไปใช้ได้เลย โดยไม่ต้องมี correction file แต่ก็จะได้คุณภาพเสียงแบบ lossy ถ้าเราอยากได้ระดับ lossless เราก็เอา correction file ไปใส่ไว้ในห้องของ lossy file นั้น โปรแกรมเล่นเพลงก็จะจัดการรวมกันให้เป็นแบบ lossless ครับ แต่ข้อเสียของ WavPack ก็คืออุปกรณ์ที่รองรับยังไม่มากเท่า FLAC ครับ การใช้งานจึงยังไม่กว้างเท่า FLAC
WavPack รองรับ sample rate ได้ตั้งแต่ 1 ถึง 16777.216 kHz ครับ ส่วน bit rate ของ lossless จะเป็น VBR แต่ในส่วนของ lossy จะใช้ที่ 192 kbps ครับ

Apple Lossless (ALAC) (.mp4, .m4a)
Apple พัฒนารูปแบบนี้ขึ้นมาเพื่อใช้กับระบบของ Apple เช่น iPod จึงมีแต่ iTunes ที่สร้างไฟล์ชนิดนี้ได้ครับ ข้อดีของ ALAC คือการที่ใช้กับ iPod ได้สมบูรณ์ครับ ความสามารถก็ไม่ได้ดีเด่นไปกว่ารูปแบบอื่นๆ แต่ข้อเสียคือยืดหยุ่นน้อยเพราะ Apple ไม่ปล่อยชุดของโปรแกรมถอดรหัส ALAC ให้กับผู้พัฒนา software อื่นๆ จึงโปรแกรมไม่กี่โปรแกรมที่เล่นไฟล์ชนิดนี้ได้ หลักๆ คือ iTunes ส่วนโปรแกรมอื่นๆ ที่เล่นได้อย่าง foobar2000 ก็เพราะมีคนไปวิจัยโค้ดที่ apple ใช้แล้วก็ reverse-engineered จนได้โปรแกรมถอดรหัสออกมาครับ ซึ่งก็ไม่ค่อยสมบูรณ์เท่าไหร่ แล้ว ALAC รองรับ sample rate แค่ 44,100 และ 48,000 Hz สรุปคือเหมาะเฉพาะผู้ใช้ iPod เท่านั้น

Windows Media Audio Lossless (.wma)
แหะๆ ขึ้นไปอ่านรายละเอียดที่ WMA lossless ในส่วนของ lossy ครับ

Monkey’s audio (.ape)
เป็นอีกรูปแบบไฟล์ที่เห็นกันบ้างบนอินเตอร์เน็ตครับ แต่ไม่นิยมเท่า FLAC ข้อดีของมันก็คือบีบอัดเสียงได้เล็กกว่ารูปแบบอื่นๆ แต่ว่าความเร็วจะไม่สูงเท่า FLAC หรือ WavPack แล้วจำนวนอุปกรณ์ที่รองรับก็น้อยกว่า FLAC ครับ ซึ่งไฟล์ชนิดนี้ก็ใช้เปิดให้ใช้ได้ฟรีเช่นกันครับ เราสามารถเข้าไปดูรายละเอียดของไฟล์ชนิดนี้ได้ที่นี้ครับ http://www.monkeysaudio.com/


เปรียบเทียบ Lossless


เปรียบเทียบความสามารถของไฟล์รูปแบบต่างๆ ซึ่งเราจะเห็นว่า monkey จะให้ขนาดไฟล์ที่เล็กที่สุดครับ (ดูในช่อง Compression) ก็คือเหลือ % ของไฟล์ต้นฉบับน้อยที่สุดครับ แล้วก็สามารถเปรียบเทียบความสามารถต่างๆ เช่นการใช้ ReplayGain ว่าไฟล์ประเภทไหนที่รองรับ RG ได้ หรือความสามารถ Hybrid/Lossy ได้จากตารางนี้ครับ
สรุปการใช้ Lossless นะครับ สำหรับคนทั่วๆ ไปที่ต้องการใช้ Lossless ผมแนะนำให้ใช้ FLAC เพราะมีโปรแกรมและอุปกรณ์จำนวนมากรองรับ จนสามารถนำไฟล์นี้ไปใช้งานได้แพร่หลายที่สุดครับ ส่วนคนที่จะใช้ไฟล์กับอุปกรณ์ที่รองรับไฟล์อื่นๆ อย่าง Apple Lossless หรือ Windows media audio lossless ก็ใช้ไฟล์รูปแบบนั้นๆ ครับ

ส่วนถ้าใครยังไม่มีตัว Encoder ต่างๆ ที่ผมว่ามา ก็เข้าไปดูได้ใน www.rarewares.org ยกเว้น
WMA ที่ใช้ Windows media player ดาวน์โหลดจาก www.microsoft.com
AAC
Nero AAC ดาวน์โหลดได้ที่ http://www.nero.com/ena/nero-aac-codec.html
Apple AAC ดาวน์โหลด iTunes จาก www.apple.com ครับ
Apple Lossless ก็ใช้ iTunes เช่นกันครับ

ส่วนวิธีการใช้งาน ผมขอยกยอดเอาไว้เขียนในบทความเรื่อง foobar2000 คราวหน้านะครับ คาดว่าเร็วๆ นี้ครับ
------------------

ก็ติดตามบทความเรื่อง foobar2000 อย่างละเอียดในนิตยสาร PCtoday เร็วๆ นี้ครับ (ดองนานมาก)


สุดท้าย อย่าลืม comment เน้อ ใครอ่านแล้วเข้ามา comment ให้หมด อยากรู้ความเห็น หุๆ ไม่งั้นไม่เอาบทความอื่นๆ มาลงให้แล้วนะ กว่าจะแปลงจากต้นฉบับลง blog ได้มันเหนื่อยเหมือนกันนะ

ป้ายกำกับ:

สารพันรูปแบบไฟล์เพลง ภาค Lossy แถมตั้ง mp3 ยังไงถึงจะแหล่ม

บทความนี้ตีพิมพ์ในนิตยสาร PCtoday ฉบับที่ 45 เดือนมกราคม ปี 2551 ครับ แต่เห็นว่ามีประโยชน์เลยเอาฉบับเต็มมาให้อ่านในนี้ด้วย

-------
ในเย็นวันศุกร์ หลังจากผ่านวันอันแสนวุ่นวายมาตลอดสัปดาห์ ผมตั้งใจว่าจะปล่อยใจล่องลอยให้ผ่อนคลายไปกับเสียงเพลงของวงดนตรีสุดโปรด เราเองก็จัดแจงซื้อซีดีเพลงมาเรียบร้อย ขณะกำลังเตรียมแปลงเพลงเป็น mp3 (rip) ลง notebook อยู่นั้น (เค้าเรียกว่าหวงแผ่น CD จะได้ไม่ต้องใช้แผ่นบ่อยๆ ให้เป็นรอย) ก็เกิดสงสัยว่าเราจะทำไฟล์ออกมาแบบไหนดี ตั้งค่ายังไงขนาดมันถึงจะเล็กแล้วเสียงยังดีอยู่
-------


ผมสงสัยเรื่องนี้มานานพอสมควร เพราะมันมีรูปแบบไฟล์เยอะเหลือเกินตั้งแต่ mp3, ogg, aac, flac, wavpack แล้วรูปแบบไหนที่มันดีสำหรับเรากัน แล้วควรจะตั้งค่ามันยังไง ตั้ง kbps เท่าไหร่ เสียงถึงจะเดิ้น ด้วยความอยากรู้ผมจึงไปค้นข้อมูลมาอ่าน แล้วก็นำมาเล่าสู่กันฟังครับ แหะๆ บทความนี้อาจจะซับซ้อนแล้วก็เต็มไปด้วยเรื่องทางวิทยาศาสตร์นะครับ เพราะเสียงคือวิทยาศาสตร์สาขาหนึ่ง ผมจะพยายามเขียนให้เข้าใจง่ายที่สุด แต่ถ้าขี้เกียจอ่านเรื่องพื้นฐานยุ่งๆ ของมัน ก็ข้ามไปอ่านสรุปของแต่ล่ะส่วน (ย่อหน้าสุดท้าย) ได้เลยครับ แต่ผมก็สนับสนุนให้รู้พื้นฐานไว้ด้วยจะดีมาก เพราะจะได้นำไปประยุกต์ใช้ได้กว้างขึ้น เอาแหละเรามาเริ่มกันที่เรื่องพื้นฐานของเสียงกันก่อนดีกว่าครับ

พื้นฐานการบีบอัดเสียง
จากความรู้วิทยาศาสตร์น่าจะสมัยม.ต้น ที่บอกว่าคนเรายินเสียงช่วงความถี่ตั้งแต่ 20 – 20,000 Hz ครับ เจ้าเลขนี้จะบอกว่าวัตถุที่กำเนิดเสียงสั่นด้วยอัตรากี่ครั้งต่อวินาที เช่นที่ 35 Hz ลำโพงก็จะสั่น 35 ครั้งต่อวินาที เราจะได้ยินเป็นเสียงต่ำครับ ส่วนความถี่ที่สูงๆ ขึ้นอย่าง 15,000 Hz จะได้ยินเป็นเสียงสูง แต่ใช่ว่าทุกคนจะยินเสียงครบทั้งหมดแบบนี้หรอกครับ เพราะประสาทหูเราจะค่อยๆ เสื่อมลง ในวัยผู้ใหญ่จึงอาจจะรับเสียงได้แค่ช่วง 20-15,000 Hz ชัดเจนเท่านั้น ส่วนเสียงอื่นๆ ก็ยังได้ยินอยู่แต่ว่าจะได้ยินเบาลง จนบางทีก็ไม่รู้สึกว่ามีเสียงนี้อยู่
แล้วในเรื่องเสียงภาคดิจิตอลยังมีตัวเลขอีก 2 ตัวเข้ามาเกี่ยวข้องครับ นั้นคือ bit depth เช่นที่มักเห็นเป็น 16 bit กับ 24 bit และ sample rate อย่าง 44,100 Hz หรือ 48,000 Hz การจะเข้าใจเรื่องนี้เราต้องเข้าใจเรื่องดิจิตอลก่อนครับ อย่างที่รู้ๆ กันครับว่าดิจิตอลเก็บข้อมูลเป็น 0 กับ 1 แต่ถ้ามันเก็บได้แค่นี้ สงสัยเราคงได้ยินแต่เสียงอิ้ดๆ แน่ๆ การเก็บเสียงเสียงดิจิตอลจึงต้องใช้ชุดของข้อมูล ถึงจะเก็บข้อมูลเสียงได้ครบ

ภาพนี้เป็นเสียง 4 bit ครับ จะเห็นว่ามีค่าทั้งหมด 16 ค่า (0-15) ในแกน y

ดูในภาพนะครับ คลื่นเสียงที่เห็นจะมีลักษณะเส้นโค้งๆ นะครับ มีสองแกนคือแกนตั้งกับแกนนอน ซึ่ง bit depth จะเกี่ยวข้องกับแกนตั้งครับ จำนวน bit depth คือจำนวนข้อมูลที่อ้างอิงได้ในแกนตั้งครับ ถ้าเก็บ 1 bit จะอ้างอิงเสียงได้ 2 ค่า อย่าง 4 bit อ้างอิงได้ 16 ค่า แล้ว 16 bit จะอ้างอิงได้ 65,536 ค่า จะเห็นว่ายิ่งเลขมากข้อมูลที่เก็บได้ยิ่งละเอียด
ส่วนอีกค่าหนึ่งคือ sample rate ค่านี้จะแทนแกนนอน มีความหมายว่าใน 1 วินาทีจะมีการเก็บข้อมูลกี่ครั้ง อย่าง 44,100 ก็คือใน 1 วินาทีจะมีการเก็บข้อมูล 44,100 ครั้งครับ ยิ่งเลขมาก ข้อมูลที่เก็บได้ก็จะยิ่งละเอียด ค่าที่เห็นบ่อยๆ คือ 44,100 Hz เพราะเป็นความละเอียดที่ใช้บนแผ่น CD เพลง แหะๆ แอบเห็นหน้างง งั้นดูภาพครับ
ภาพนี้ใช้ bit depth ที่ 16 bit มีค่าตั้งแต่ -32,768 ถึง 32,767 และมีแท่งตั้งๆ แทนจำนวนการเก็บข้อมูล 44,100 แท่งแทน 44,100 ครั้งต่อวินาที


แล้วทำไมยิ่ง bit-depth และ sample rate สูงแล้วยิ่งเก็บข้อมูลเสียงได้ละเอียด เราลองมาดูภาพนี้กันนะครับ
เส้นสีเทาคือสัญญาณเสียงในระบบอนาล็อก หรือเสียงจากธรรมชาติครับ การจะนำมาเก็บเป็นข้อมูลดิจิตอล เส้นสีเทาจะถูกแปลงเป็นเส้นสีแดง ซึ่งจะเห็นได้ว่ามันไม่ทับกัน แค่ใกล้เคียงกัน เพราะสัญญาณดิจิตอลจะอ้างอิงลักษณะของคลื่นเสียงจาก sample rate (แกนนอน) และ bit-depth (แกนตั้ง) เพื่อนำมาแทนเสียง เราจะเห็นความละเอียดของทั้งสองแกนจากช่องสี่เหลี่ยมปะๆ ด้านหลังเส้นครับ เพราะฉะนั้นยิ่งมี sample rate และ bit-depth ที่สูงขึ้น ช่องสี่เหลี่ยมปะๆ ที่ใช้อ้างอิงสัญญาณดิจิตอลก็จะยิ่งถี่ขึ้น ละเอียดขึ้น สัญญาณที่สร้างจากแกนอ้างอิงนี้จึงละเอียดขึ้นด้วย จนสามารถแทนเสียงธรรมชาติได้ใกล้เคียงที่สุด
สรุปนะครับ ยิ่ง bit-depth มาก และ sample rate สูง เสียงก็จะยิ่งดี แต่มีข้อควรจำอยู่ว่า ถ้าต้นฉบับมี bit-depth และ sample rate อยู่แล้ว การไปเพิ่มให้มันสูงขึ้น ไม่ได้ทำให้เสียงดีขึ้นนะครับ เพราะคุณจะเอาข้อมูลที่ไหนไปเพิ่มให้กับเสียงที่มีข้อมูลอยู่เท่านั้น แถมยังทำให้ไฟล์ใหญ่ขึ้นโดยไม่มีประโยชน์อีกตั้งหาก เช่นแผ่น CD มี bit-depth ที่ 16 bit และ sample rate ที่ 44,100 Hz การที่เราไปสั่ง rip เพลงให้เป็น mp3 ที่มี sample rate 48,000 Hz ไม่ทำให้เสียงดีขึ้นครับ

ประเภทของการบีบอัดเสียง
การบีบอัดเสียงมี 2 ประเภทครับ คือแบบ lossless กับ lossy ซึ่ง lossless คือการบีบอัดที่ไม่มีการเสียข้อมูลเสียงเลย ต้นฉบับเป็นอย่างไร ไฟล์ที่บีบอัดแล้ว เมื่อคลายออกมาจะเหมือนเดิมเป๊ะๆ แต่ข้อเสียของไฟล์ประเภทนี้คือขนาดที่ค่อนข้างใหญ่กว่าแบบ lossy พอสมควร
เราจะดูจำนวนข้อมูลที่ใช้จาก bit rate ซึ่งมีหน่วยเป็น kbps ครับ มันย่อมาจาก kilo bit per second หรือจำนวนบิตที่ใช้ใน 1 วินาที ยิ่งใช้บิตต่อวินาทีมาก จะเก็บข้อมูลได้มาก แต่ขนาดไฟล์ก็จะยิ่งใหญ่ครับ
อย่างไฟล์ FLAC กับเพลงยาว 5 นาที จะใช้พื้นที่ราวๆ 30 Mb ถ้าดูที่ bit rate ก็จะใช้ราวๆ 900 kbps (เพลงในแผ่น CD จะใช้ bit rate ที่ 1411 kbps ครับ) เทียบกับ mp3 ทั่วๆ ไปที่ใช้ 128 kbps ก็จะใหญ่กว่า 8-9 เท่าเลยทีเดียว แต่แน่นอนว่าเสียงดีกว่ากันแบบเทียบกันไม่ได้เลย รูปแบบไฟล์ที่เป็นแบบ lossless ก็เช่น FLAC, WavPack, Apple Lossless, WMA Lossless ครับ ส่วน wav ไม่ถือว่าเป็น lossless นะครับ เพราะไม่ได้บีบข้อมูลอะไร
ส่วน Lossy คือการบีบอัดที่ทิ้งข้อมูลออกไปบ้าง เช่นเสียงสูงๆ เหนือกว่า 15000 Hz ก็จะถูกตัดทิ้งออกไป ส่วนจะตัดอย่างไรบ้างขึ้นอยู่กับโมเดลเสียงที่มนุษย์รับรู้ (psychoacoustic model) ที่อยู่ในโปรแกรมเข้ารหัสเสียงครับ (Encoder) แล้วจะตัดเยอะแค่ไหนขึ้นอยู่กับ bit rate ที่ใช้ ยิ่งใช้ค่าสูง ก็จะตัดข้อมูลน้อย ไฟล์ยิ่งใหญ่ เสียงยิ่งดีครับ ที่นี้จึงเป็นปัญหาของเราว่าควรจะใช้ bit rate เท่าไหร่ดี อ่านไปเรื่อยๆ ครับผมจะอธิบายให้ฟัง ส่วนรูปแบบไฟล์ที่เป็น Lossy ก็เช่น mp3, mp2, ogg, wma, aac ครับ
ข้อควรจำนะครับ ด้วยความที่ lossy มีการตัดข้อมูลออกมาบ้างระหว่างการแปลงไฟล์ เราจึงควรหลีกเลี่ยงการนำไฟล์ lossy มาแปลงไฟล์ซ้ำๆ ครับ เช่นเอา mp3 ที่ 128 kbps มาแปลงเป็น ogg ที่ 160 kbps เสียงที่ได้ก็จะแย่กว่า mp3 ด้วยซ้ำ เพราะข้อมูลเรามีอยู่เท่านี้ แต่เราไปแปลงมันอีก ให้มันตัดทอนข้อมูลลงไปอีกครับ รวมถึงการแปลงจาก lossy ไปยัง lossless ด้วยนะครับ อย่าง mp3 -> flac ขนาดไฟล์จะใหญ่ขึ้นมาก แต่คุณภาพก็เท่ากับ mp3 นั้นแหละครับ เออ การเซฟเป็นไฟล์แบบ lossy ซ้ำๆ ก็ทำให้เสียคุณภาพได้ด้วยนะครับ อย่างเราเปิดไฟล์ mp3 ขึ้นมาตัดต่อ แล้วเซฟทับลงไปในไฟล์เดิม ยิ่งเซฟทับบ่อยครั้งเท่าไหร่ คุณภาพไฟล์ก็จะเสียไปเยอะเท่านั้นครับ
สรุปนะครับ ถ้าต้องการเสียงดีๆ หรือเก็บไฟล์ระดับที่เทียบเท่าต้นฉบับ แบบว่าถ้าแผ่นต้นฉบับพังแล้วเอาไฟล์นี้ไปไรท์ใหม่ จะได้คุณภาพเท่าเดิมเลย ให้ใช้ไฟล์แบบ lossless ครับ แต่ถ้าพื้นที่น้อย แล้วลองฟังดูแล้ว แยกความแตกต่างระหว่างเสียงจาก Lossless และ Lossy ไม่ได้ ก็บีบเป็นพวก Lossy ก็ได้ครับ

ภาพจาก spectrum analyzer เพลงเดียวกันนะครับ คู่บนคือไฟล์ที่บีบด้วย FLAC ซึ่งเป็น lossless ส่วนคู่ล่างเป็นไฟล์ที่บีบเป็น mp3 ด้วย LAME ระดับ V5 (ราวๆ 130 kbps) ซึ่งเป็นแบบ lossy นะครับ สังเกตดีๆ ครับ ส่วนบนของกราฟคู่บนจะอยู่ครบ แต่ในคู่ล่างส่วนนี้จะถูกตัดออกไป เห็นเรียบเตียนไปเลย ซึ่งก็คือเสียงที่ความถี่สูงๆ ถูกตัดออกไปนั่นเองครับ



ลักษณะของการใช้ Bit-rate

จบเรื่องประเภทไปก็มาเข้าเรื่องลักษณะของการใช้ bit rate กันต่อเลยครับ คุณผู้อ่านเคยสังเกตเห็นไฟล์ mp3 ที่เวลาเราเล่นแล้วตัวเลขตรง kbps มันเปลี่ยนไปเปลี่ยนมารึปล่าวครับ ไม่ได้แสดงคงที่ที่ 128 kbps ตลอดเวลา ถ้าคุณเคยเห็นก็แปลว่ากำลังเห็นผี mp3 ตามหลอกหลอนนนคุณอยู่... แหะๆ ไม่ใช่ครับมันเป็น mp3 ที่ใช้ bit rate แบบ VBR หรือ ABR ครับ
ลักษณะของการใช้ Bit rate จะมีสามแบบคือ CBR, VBR, ABR ซึ่งแตกต่างกันดังนี้
CBR (constant bitrate) เป็นการใช้ bit rate ที่พื้นฐานที่สุด ซับซ้อนน้อยที่สุด ให้คุณภาพแย่ที่สุด แต่เราเห็นใช้กันมากที่สุด CBR คือใช้ bit rate คงที่ ไม่ว่าเสียงตอนนั้นจะซับซ้อน หรือไม่มีเสียงอะไร bit rate ก็จะยังค้างอยู่ค่านั้น ไม่ยืดหยุ่นใดๆ เช่นค้างอยู่ที่ 128 kbps ตลอดเวลา ข้อดีของมันคือ เราคำนวณขนาดไฟล์ได้ก่อนที่จะแปลงไฟล์ และเหมาะสมสำหรับทำ streaming แบบที่ห้ามใช้ bit rate เกินจากที่กำหนด
ABR (average bitrate) อยู่ตรงกลางระหว่าง CBR กับ VBR ครับ ลักษณะของ ABR คือ bit rate จะขึ้นๆ ลงๆ ได้ตามความซับซ้อนของเสียงในขณะนั้น แต่จะให้ผู้ใช้ระบุค่าได้ว่าจะให้ bit rate อยู่ราวๆ ไหน เช่นป้อนไปที่ 128 kbps ระดับของ bit rate จะขึ้นๆ ลงๆ อยู่ประมาณ 128 kbps ครับ
VBR (variable bitrate) เป็นการใช้ bit rate ที่ให้ประสิทธิภาพสูงที่สุด เป้าหมายของ VBR จะต่างจาก ABR และ CBR ครับ คือ VBR จะพยายามคงระดับคุณภาพของเสียงให้คงที่ตลอดเพลง ด้วย bit rate ที่ต่ำที่สุดเท่าที่จะเป็นไปได้คือดูจากคุณภาพเสียงเป็นหลัก เช่นช่วงที่ไม่มีเสียง มันก็ใช้ bit rate ที่ต่ำที่สุดเลยคือ 32 kbps ต่างจากอีก 2 อย่างที่เหลือที่จะพยายามคง bit rate ตามที่กำหนดเอาไว้ ส่วนคุณภาพเสียงจะแกว่งๆ ไม่เท่ากันทั้งเพลง ข้อเสียของ VBR ก็ตรงข้ามกับ CBR ครับ คือเราไม่สามารถคำนวณขนาดไฟล์ที่จะได้ เพราะ bit rate ที่ใช้มันจะเปลี่ยนไปเรื่อยๆ และเรื่อง streaming ที่เราคุม bit rate ไม่ได้ครับ
สรุปนะครับ VBR จะให้เสียงคุณภาพดีที่สุด ABR อยู่ในระดับรองลงมา แล้ว CBR อยู่ท้ายสุด เพราะฉะนั้นเวลาจะใช้ก็ใช้เป็น VBR ดีกว่าครับ

การบีบอัดเสียงประเภทต่างๆ

MP3 (MPEG Audio Layer-3)
เป็นรูปแบบไฟล์ที่พวกเรารู้จักกันดีนะครับ เพราะเกิดขึ้นมานานแล้ว (เข้าสู่มาตรฐาน ISO เมื่อปี 1991) ถือเป็นรูปแบบไฟล์แบบ lossy ตัวแรกที่ได้รับความนิยมในวงกว้าง เพราะความสามารถในการบีบอัดที่สามารถลดข้อมูลได้กว่า 10 เท่า ในคุณภาพที่ยอมรับได้ ข้อดีของ mp3 คือเป็นรูปแบบไฟล์ที่ใช้กันอย่างแพร่หลาย หาเครื่องเล่นง่าย ทำให้มั่นใจว่าถ้าบีบอัดเป็น mp3 แล้วจะหาเครื่องเล่นได้แน่ๆ แต่ข้อเสียคือมีประสิทธิภาพน้อยกว่ารูปแบบไฟล์ใหม่ๆ เช่น ogg หรือ aac แล้วก็ยังไม่สามารถเก็บเสียงความละเอียดสูงเกินกว่า 48,000 Hz แถมยังใช้ Bit rate สูงสุดได้แค่ 320 kbps บางทีมันก็ไม่เพียงพอสำหรับระดับหูทองคำ เก็บเสียง multichannel ไม่ได้ แล้วยังมีปัญหาเรื่องสิทธิบัตรอันแสนจะวุ่นวายด้วยครับ
เรื่อง mp3 ที่ผมจะพูดถึงวันนี้จะอ้างอิงข้อมูลจาก LAME encoder นะครับ ซึ่ง LAME นี้ถือเป็นโปรแกรมแปลงไฟล์ MP3 ที่ดีที่สุดตัวหนึ่งในปัจจุบัน พัฒนากันมาตั้งแต่ปี 1998 จนปัจจุบันอยู่ที่รุ่น 3.97 ครับ LAME ถูกนำไปใช้ในโปรแกรมมากมาย เช่น Flash รวมถึงโปรแกรมแปลงเพลงต่างๆ ที่เราใช้กันอยู่อย่าง CDex, dBPowerAmp หรือ Winamp (Mp3Dev ก็คือ LAME ครับ) ที่สำคัญมันเป็น freeware ด้วยครับ

การทดลองคุณภาพของ mp3 ที่ได้จาก encoder ตัวต่างๆ คือ LAME 3.95, FhG จาก Adobe Audition, iTune 4.2 ครับ บีบอัดที่ 128 kbps จะเห็นว่า LAME ได้คะแนนสูงที่สุดครับ ถ้าอยากดูผลเต็มๆ ก็กดที่รูปได้ครับ


จากที่กล่าวไปข้างต้นว่าหากเรียงลำดับคุณภาพจากมากไปน้อยแล้วจะเป็นตามนี้ VBR > ABR > CBR เพราะฉะนั้นเวลาแปลง MP3 จึงควรใช้เป็น VBR ซึ่ง LAME จะใช้ค่า VBR เป็น V (แต่บางโปรแกรมใช้ Q ครับ) ต่างๆ ตั้งแต่ V0 ซึ่งมีคุณภาพสูงที่สุดจนถึง V9 ที่คุณภาพแย่ที่สุด แต่ว่าขนาดเล็กที่สุด สรุปเป็นตารางได้ดังนี้

ระดับ

Preset

Bit rate เป้าหมาย (kbps)

ช่วงของ bit rate

จะตัดเสียงตั้งแต่ความถี่นี้ขึ้นไป

Resample

V0

--preset fast extreme

240

220...260

19383 Hz - 19916 Hz


V1


210

200...250

18671 Hz - 19205 Hz


V2

--preset fast standard

190

170...210

18671 Hz - 19205 Hz


V3


175

155...195

17960 Hz - 18494 Hz


V4

--preset fast medium

165

145...185

17960 Hz - 18494 Hz


V5


130

110...150

16538 Hz - 17071 Hz


V6


115

95...135

15826 Hz - 16360 Hz


V7


100

80...120

14581 Hz - 14968 Hz

32000 Hz

V8


85

65...105

12516 Hz - 12903 Hz

32000 Hz

V9


65

45...85

9774 Hz - 10065 Hz

24000 Hz


จากตารางจะเห็นได้ว่านอกจากที่ V สูงๆ จะใช้ bit rate ที่ต่ำมาก จึงให้ขนาดไฟล์ที่เล็กแล้ว อย่าง V9 ที่ใช้ bit rate แค่ประมาณ 65 kbps แต่ว่าเสียงช่วงตั้งแต่ 9774 Hz ขึ้นไปจะถูกตัดทิ้ง แล้วเสียงยังถูกลดความละเอียดลงเหลือแค่ 24000 Hz ด้วย จึงไม่เหมาะกับเสียงดนตรีอย่างแรง
แล้ว bit rate ไหนที่ควรใช้ เราลองมาดูกราฟนี้กันครับ

จะเห็นได้ว่าตั้งแต่ V3 ขึ้นไป ระดับคุณภาพ (Quality) เพิ่มขึ้นไม่มาก แต่ขนาดไฟล์เพิ่มขึ้นอย่างต่อเนื่อง จนถึงระดับสูงสุดคือ CBR 320 kbps คุณภาพก็ไม่แตกต่างจาก V3 มากนัก เพราะฉะนั้นระดับที่ควรใช้จึงเป็นราวๆ V3 (ประมาณ 175 kbps) หรือ V2 (ประมาณ 190 kbps) ครับ ก็จะได้เสียงที่ดีจนแยกไม่ออกจากต้นฉบับเลย ถ้าสูงกว่านี้จะเป็นระดับที่ใช้เก็บรักษาต้นฉบับแล้วครับ เช่นระดับสูงสุดของ mp3 คือ CBR 320 kbps ซึ่งถ้าต้องการนำไปใช้ในงานแบบนี้ แนะนำให้ใช้เป็นไฟล์ lossless ไปเลยดีกว่าครับ แต่ถ้าต้องการขนาดที่เล็กกว่านี้ เช่นอยากเอาไปใส่ในเครื่องเล่น mp3 ที่มีความจุไม่มาก ก็แนะนำให้ใช้ราวๆ V5 ครับ
แล้วถ้าโปรแกรมของคุณให้เลือก preset ได้ อย่าง --preset fast medium ก็ไม่ต้องสงสัยไปครับ มันก็คือ VBR ระดับ V4 ที่ใช้ VBR new ด้วยนั้นเอง ไม่แตกต่างกันกับการสั่งด้วย V4 VBR new เลย สั่งได้เหมือนกันทั้งคู่ครับ แล้วที่นี้ VBR new คืออะไร มันคือตัวเลือกหนึ่งของ LAME ครับ ถ้าโปรแกรมของคุณมีให้เลือกใช้ VBR new ก็เลือกใช้ไปเลยครับ เพราะจะทำงานได้เร็วกว่า และคุณภาพสูงกว่า
ต่อมาถ้าโปรแกรมที่คุณใช้ให้เลือกประเภทของ Stereo ได้ว่าจะเป็น Stereo, Joint Stereo, Mono ให้เลือกเป็น Joint Stereo ครับ ประสิทธิภาพจะดีที่สุด คือจะทำให้ลดข้อมูลที่ต้องเก็บได้ แต่คุณภาพยังเป็นระดับ Stereo อยู่ เพราะว่า Joint Stereo จะใช้วิธีจัดการเสียง Stereo 3 แบบผสมกัน ให้เหมาะกับเสียงต่างๆ จึงทำให้ใช้ bit rate ได้คุ้มค่าที่สุดครับ แต่ถ้าโปรแกรมของคุณเลือกไม่ได้ มันก็มักจะตั้งให้เป็น Joint Stereo ให้อยู่แล้วครับ
สรุปนะครับ ถ้าโปรแกรมให้เลือก bit rate ต่ำสุด/สูงสุดสำหรับ VBR ได้ ต่ำสุดก็เลือกเป็น 32 kbps แล้วสูงสุดเป็น 320 kbps ครับ ที่นี้ถ้าต้องการเสียงที่ดี แต่ไม่ใช้พื้นที่เยอะโอเวอร์ ให้เลือกเป็น VBR V2 (ราวๆ 190 kbps) แล้วใช้ vbr new กับ Joint Stereo ครับ ถ้าต้องการขนาดพอดีๆ แล้วเสียงยังใช้ได้อยู่ ให้เลือกเป็น VBR V5 (ราวๆ 130 kbps) ใช้ vbr new กับ Joint Stereo เช่นกันครับ



Ogg Vorbis (.ogg)
รูปแบบไฟล์ชนิดนี้เป็นรูปแบบไฟล์โปรดของผมเลยครับ เพลงในเครื่องทุกเพลงที่ผม rip เองจะเป็นไฟล์นี้ครับ ข้อดีของไฟล์นี้คือมีประสิทธิภาพสูง ให้เสียงคุณภาพดีกว่า mp3 ใน bit rate ที่เท่ากัน สามารถรองรับ Sample rate ได้สูงสุดถึง 200,000 Hz ใช้ bit-rate ได้กว้างมาก เป็น multi channel ก็ได้ แล้วก็เป็นรูปแบบไฟล์ที่ฟรีอย่างแท้จริง ไม่มีการเรียกเก็บค่าลิขสิทธิ์หรือค่าสิทธิบัตรการใช้ไฟล์ใดๆ ทั้งสิ้น แต่ข้อเสียสำคัญของมันคือไม่แพร่หลายเท่า MP3 ครับ มีเพียงเครื่องเล่น MP3 บางยี่ห้อเท่านั้นที่เล่นไฟล์ชนิดนี้ได้ อืม iPod ก็เล่นได้นะครับ แต่ต้องใช้ Firmware พิเศษอีกตัวหนึ่งที่ชื่อว่า Rockbox
Ogg Vorbis เป็นชื่อรวมกันระหว่าง Ogg ซึ่งเป็น Container และ Vorbis ที่เป็นชื่อของตัวรหัสเสียง ถ้าเราเรียกเฉพาะเทคโนโลยีที่ใช้บีบอัดเสียงอย่างเดียวจะเรียกว่า Vorbis ครับ
ด้วยความที่ Ogg Vorbis เป็นไฟล์ที่ไม่มีค่าใช้สิทธิ์ จึงถูกนำไปใช้ในงานหลายๆ แบบ เช่นเอาไปใช้ในเกม อย่าง Doom3, GTA:SA, เกมตระกูล Unreal เป็นต้น เรียกได้ว่าแม้คนทั่วไปจะใช้ Vorbis ไม่เยอะเท่า mp3 แต่ Vorbis ก็เป็นรูปแบบไฟล์ที่สำคัญตัวหนึ่งบนโลกคอมพิวเตอร์ครับ
Ogg Vorbis รุ่นแรกออกมาในเดือนกรกฎาคม ปี 2002 โดย Xiph.Org Foundation ครับ หลังจากนั้นก็ได้พัฒนาเรื่อยมาจนมาถึงรุ่น 1.2.0 แต่รุ่นที่ผมจะแนะนำให้ใช้ไม่ใช่รุ่นนี้หรอกครับ เพราะ Xiph.Org ไม่ได้พัฒนาเพิ่มเติมในส่วนของประสิทธิภาพมานานแล้ว ความสามารถของรุ่นนี้จึงสู้รุ่น aoTuV (Aoyumi's Tuned Vorbis) ที่พัฒนาโดยชาวญี่ปุ่นชื่อ Aoyumi ไม่ได้ครับ ปัจจุบัน aoTuV อยู่ที่รุ่น Beta 5.5 ครับ ข้อมูลคราวนี้ของผมจึงอ้างอิงจาก aoTuV Beta 5 เป็นหลักครับ

จากที่ผมเคยพูดถึงเรื่อง CBR, VBR ไปแล้วนะครับ Vorbis ก็รู้เรื่องนี้ดี มันจึงไม่มีการบีบอัดแบบ CBR ให้เลือก มีแค่ ABR และ VBR ครับ ซึ่ง VBR ของ vorbis จะใช้ q แทนระดับคุณภาพของเสียงดังนี้ครับ

ตัวเลือก

Bit rate เป้าหมาย โดยประมาณ (kbps)

ช่วงของ bit rate (kbps)

-q -2

~32

~32 – ~64

-q -1

~48

~48 – ~64

-q 0

~64

~64–~80

-q 1

~80

~80 – ~96

-q 2

~96

~96 – ~112

-q 3

~112

~112 – ~128

-q 4

~128

~128 – ~160

-q 5

~160

~160 – ~192

-q 6

~192

~192 – ~224

-q 7

~224

~224 – ~256

-q 8

~256

~256 – ~320

-q 9

~320

~320 – ~500

-q 10

~500

~500 – ~1000

ตารางนี้เฉพาะ auTuV เท่านั้นนะครับ

แล้วค่าไหนที่ควรใช้บ้าง ค่าที่เหล่าผู้เชี่ยวชาญเรื่องเสียงจากเว็บ Hydrogen Audio แนะนำมีสองค่าครับ ถ้าต้องการไฟล์ขนาดเล็ก สำหรับเครื่องที่พื้นที่น้อยๆ หรือใส่ในเครื่องเล่นเพลง ที่ระดับ q 2 ก็เพียงพอสำหรับคนทั่วไปที่ไม่ต้องการความละเอียดเรื่องเสียงมากแล้วครับ ผมลองดูแล้วระดับนี้จะให้เสียงดีกว่า mp3 ที่ 128 kbps นิดหน่อยครับ แต่ถ้าต้องการไฟล์ที่มีคุณภาพใกล้เคียงกับ CD มากแบบแยกกันไม่ออก ก็แนะนำที่ระดับ q 5 ครับ ถ้าใครยังไม่สะใจก็เพิ่มขึ้นได้อีก แต่ q 5 คือขั้นต่ำที่สุดที่ยอมรับกันว่าเสียงใกล้เคียงกับ CD มากแล้วครับ แต่ก็ต้อง rip จาก CD จริงๆ นะครับ ไม่ใช่ไปแปลงไฟล์แบบ lossy ตัวอื่นมา
สรุปนะครับถ้าต้องการใช้ OGG ก็ให้ใช้รุ่น aoTuV beta5.5 ไปเลยครับ ผมทดลองรุ่นนี้มาพอสมควรแล้ว ทั้งเล่นบนคอมพิวเตอร์ และเครื่องเล่น mp3 ก็ไม่มีปัญหาใดๆ ส่วนการเลือกคุณภาพ ใช้ q 2 สำหรับงานที่ต้องการขนาดไฟล์เล็กๆ ครับ และ q 5 สำหรับงานที่ต้องการคุณภาพเทียบเท่า CD


AAC (Advanced Audio Coding) (.m4a , .aac , .mp4)

มาถึงเทคโนโลยีการบีบอัดไฟล์แบบที่ 3 กันแล้วนะครับ กับ AAC ผู้ร่วมพัฒนาเทคโนโลยีนี้คือผู้พัฒนา mp3 นั่นเอง ทำให้รูปแบบนี้มีความสามารถเหนือกว่า mp3 ครับ ปัจจุบันยังไม่แพร่หลายในวงกว้างเท่าไหร่ แต่รูปแบบนี้เป็นไฟล์มาตรฐานบน iTunes Store และ iTunes ก็แนะนำให้ใช้ AAC เวลา rip เพลง เทคโนโลยีนี้จึงใช้มากบน iPod ครับ ซึ่งมีผู้ใช้มากขึ้นเรื่อยๆ จนทำให้หลายค่ายเริ่มออกมารองรับไฟล์ชนิดนี้ อย่าง Sony เป็นต้น
ข้อดีของ AAC ที่เหนือกว่า mp3 ก็คือ รองรับ sample rate มากขึ้นเป็น 8,000 – 96,000 Hz แล้วยังรองรับได้ถึง 48 ช่องสัญญาณ ทำให้ทำ multichannel ได้ แล้วยังให้คุณภาพเสียงที่สูงกว่า mp3 ด้วยเทคนิคการบีบอัดแบบใหม่ๆ ครับ แต่ข้อเสียของมันอยู่ที่การที่มันมีรูปแบบภายในเยอะ เช่น LC, HE, SSR, LTP ฯลฯ ทำให้มีปัญหากับเครื่องเล่น บางเครื่องอาจจะเล่น HE-AAC ไม่ได้ แต่เล่น LC-AAC ได้ ซึ่งก็ต้องอ่านคู่มือดูนะครับ ว่าเครื่องคุณเล่นไฟล์อะไรได้บ้าง แล้วยังมีปัญหาเรื่องสิทธิบัตรยุ่งวุ่นวาย เพราะหลายบริษัท พัฒนาหลายเทคโนโลยี แล้วก็ถือสิทธิบัตรในเทคโนโลยีต่างๆ
AAC มี 2 แบบใหญ่ๆ ครับ คือ LC (Low Complexity) และ HE (High Efficiency) ความแตกต่างระหว่าง 2 ตัวอยู่ที่ LC จะมีความซับซ้อนน้อยกว่า จึงเหมาะกับไฟล์ที่ใช้ bit rate มากกว่า 80 kbps ครับ เพราะมี bit rate เยอะพอที่จะเก็บข้อมูลได้ดีพอ ไม่ต้องใช้กระบวนการพิเศษกับข้อมูล ทำให้ LC-AAC สามารถใช้กับเครื่องเล่นที่เล่น AAC ส่วนใหญ่ได้
แต่ HE นั้นจะใช้วิธีบีบอัดไฟล์แบบพิเศษ คือ Spectral band replication (SBR) ในการจัดการกับเสียงความถี่สูง แบบเดียวกับที่ใช้ใน mp3pro และ Parametric Stereo เพื่อจัดการเสียง stereo (จะมีใน HE-AAC รุ่นที่ 2 ครับ) แต่ 2 วิธีพิเศษนี้จะไม่เหมาะเมื่อใช้ bit rate สูงๆ เพราะว่าทั้งสองวิธีเป็นการโยนข้อมูลต้นฉบับทิ้งไปครับ แล้วใช้ความสามารถของคณิตศาสตร์ในการคำนวณข้อมูลที่สูญหายกลับขึ้นมา เพื่อให้ใช้ bit rate ต่ำลง แม้ว่ามันจะให้คุณภาพที่ดี แต่ยังสู้ของแท้ๆ จากต้นฉบับไม่ได้ เพราะฉะนั้นเมื่อมี bit rate มากพอ จึงไม่แนะนำให้ใช้ HE ครับ นอกจากนี้ยังมีเครื่องเล่นบางรุ่นเท่านั้นที่รองรับ HE-AAC การใช้งานจึงไม่กว้างเท่า LC-AAC รูปแบบของ HE จึงเหมาะกับไฟล์ที่ต้องใช้ bit-rate น้อยกว่า 80 kbps ครับ ซึ่งถ้าใช้ Nero AAC Encoder มันจะเลือกใช้ให้เราโดยอัตโนมัติ แต่ถ้าใช้ iTunes จะสร้างไฟล์แบบ HE ไม่ได้ แถม iPod ก็ยังเล่น HE-AAC ไม่ได้ครับ ช่างน่าเสียดายจริงๆ
ส่วนสารพัดเครื่องหมายการค้าของไฟล์ AAC นั้น เครื่องหมายที่หมายถึง HE-AAC มีดังนี้ครับ
aacPlus และ aacPlus v2 (HE-AAC รุ่นที่ 2) ของ Coding Technologies
Nero Digital ของ Nero
AAC+ ของ Nokia, Samsung และ Motorola แต่ถ้าเขียนว่า eAAC+ จะหมายถึง HE-AAC รุ่นที่ 2 ส่วน Motorola จะใช้ AAC+ Enhanced แทน HE-AAC รุ่นที่ 2 ครับ

นอกจากจะมีลักษณะภายในของไฟล์มากมาย และชื่อทางการค้ามากมายแล้ว AAC ยังใช้นามสกุลของไฟล์มากมาย เช่น
.mp4 ใช้ container ของ mp4 ซึ่งอาจจะเก็บทั้งภาพและเสียง หรือเสียงอย่างเดียวก็ได้ แต่ไฟล์ .mp4 ก็ไม่ใช่ AAC เสมอไป
. m4a ใช้ container ของ mp4 แต่เก็บเฉพาะเสียง
.m4p อันนี้เป็นไฟล์แบบ Protect ไว้ครับ
.m4b ไฟล์สำหรับ audiobook
.aac ไฟล์ที่ใช้โครงสร้างของ AAC เพียวๆ ไม่ได้ถูกห่อด้วย container ของ mp4

แต่ iPod จะไม่รองรับไฟล์นามสกุล .aac นะครับ เขียนมาถึงตรงนี้ผมก็ปวดหัวกับเจ้า AAC นี้ไม่น้อยเลย จนทำให้รู้สึกว่าโลกของธุรกิจจะทำให้ชีวิตพวกเรายุ่งยากขึ้น สร้างสารพัดเทคโนโลยีขึ้นมา แล้วดันไม่รองรับให้ทั้งหมด
แบบว่าเหนื่อยแล้ว ผมสรุปส่วนของการใช้งานเลยแล้วกันครับ ถ้าต้องการใช้ไฟล์ AAC นั้น ผมแนะนำ Encoder 2 ตัวคือ iTunes หรือไม่ก็ Nero AAC ครับ ทั้งสองตัวนี้ก็ใช้ฟรีทั้งคู่ ถ้าใครใช้ iPod ก็ใช้ iTunes ไปเถอะครับ จะได้ไม่มีปัญหาอะไร แต่ถ้าใครไม่อยากใช้ iTunes หรือใช้อุปกรณ์ค่ายอื่นก็ลองอ่านดูดีๆ ครับว่าอุปกรณ์ของท่านรองรับ AAC แบบไหนบ้าง ถ้ารองรับได้ถึง HE-AAC v2 ก็แนะนำ Nero AAC เต็มอัตราเลยครับ แต่ถ้ารองรับไม่ถึง ก็สามารถสั่ง nero ได้ ว่าเอาแค่มาตรฐานนี้ หรือไม่ก็ rip ให้มากกว่า 80 kbps ครับ จะได้ไฟล์ LC-AAC มาโดยอัตโนมัติ สำหรับค่าที่ควรใช้เวลา rip เพลงนะครับ ถ้าต้องการไฟล์เล็กๆ ก็ใช้ที่ประมาณ 128 kbps ถ้าต้องการคุณภาพสูงหน่อย ก็ใช้ประมาณ 160 kbps ครับ ถ้าเครื่องรองรับ HE-AAC ก็สามารถใช้ bit rate ที่ต่ำกว่านี้ได้ อย่าง 50-70 kbps ครับ


WMA (Windows Media Audio) (.wma)
มาถึงไฟล์ชนิดสุดท้ายในรูปแบบของ Lossy ที่ผมจะเขียนถึงซะทีนะครับ กว่าผมจะเขียนมาถึงตรงนี้ก็ใช้เวลาหลายวันอยู่ แล้วก็คงใช้เวลาอีกหลายวันกว่าบทความจะเสร็จ เอาน่า สู้ตายเก็บเงินซื้อลำโพง
หลายคนอาจจะคิดว่า WMA ก็น่าจะมีอย่างเดียวนิน่า เพราะเราก็เห็น WMA มาตั้งแต่ไหนแต่ไรแล้ว แต่จริงๆ แล้ว WMA แยกย่อยเป็น 4 เทคโนโลยีดังนี้ครับ
Windows Media Audio (WMA)
เป็นรูปแบบไฟล์ WMA ดั้งเดิมที่พวกเรารู้จักกันครับ สามารถเล่นกับเครื่องเล่นที่รองรับ WMA ได้มากที่สุด แต่ประสิทธิภาพนั้นเท่าๆ กับ mp3 แต่ mp3 (โดยเฉพาะ LAME รุ่นล่าสุด) จะทำได้ดีกว่าใน bit rate ที่มากกว่า 128 kbps รุ่นล่าสุดคือ 9.2 ที่มากับ Windows media player 11
WMA รองรับ sample rate สูงสุดที่ 48,000 Hz ครับ แล้วเพิ่งใช้ VBR ได้ในรุ่น 9 นี้เอง ผมจึงไม่แนะนำให้ใช้ WMA แบบนี้ เพราะประสิทธิภาพไม่ดีเท่าไหร่ แถมการใช้งานยังไม่กว้างเท่า mp3 ด้วยครับ

Windows Media Audio Professional (WMA pro)
เป็นรูปแบบที่พัฒนาขึ้นมาใหม่ครับ ไม่รองรับกับมาตรฐาน WMA เดิม เริ่มมีพร้อมกับ Windows media player 9 ปัจจุบันเป็นรุ่น WMA 10 pro ข้อดีของรูปแบบนี้ให้ประสิทธิภาพที่ดีกว่า WMA มาก ในทุกด้าน ทั้งที่ bit rate สูงและต่ำ แล้วยังรองรับ sample rate ได้ถึง 96,000 Hz ที่ 24 bit แล้วยังทำได้ถึง 8 ช่องสัญญาณ (7.1 channel) ความสามารถของ WMA pro จึงสามารถเทียบชั้นกับ Vorbis, AAC ได้ และเหนือกว่า mp3 ครับ
แต่ข้อเสียของ WMA pro นี้คือการที่ไม่รองรับกับมาตรฐาน WMA เดิม ทำให้อุปกรณ์ที่เคยเล่น WMA เดิมได้ไม่สามารถเล่น WMA pro นี้ได้ จึงมีอุปกรณ์ไม่กี่ชนิดที่รองรับ เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี windows media player 10 เป็นต้น

Windows Media Audio Lossless (WMA lossless)
รูปแบบนี้ก็เพิ่งมาใหม่ใน Windows media player 9 ครับ เป็นรูปแบบไฟล์ที่จัดเก็บแบบไม่มีการสูญเสียข้อมูลใดๆ ครับ ความสามารถก็จัดอยู่ในระดับที่ดี แต่ก็ยังมีอุปกรณ์ที่รองรับน้อยอยู่ อุปกรณ์ที่รองรับก็เช่นโทรศัพท์มือถือที่ใช้ Windows mobile ที่มี Windows media player 10 หรือ Zune 2 ครับ

Windows Media Audio Voice (WMA voice)
เป็นรูปแบบที่ออกแบบมาเพื่อจัดเก็บเสียงพูดโดยเฉพาะครับ ใช้ bit rate ต่ำมาก แต่คุณภาพเสียงพูดยังใช้ได้อยู่ ทำงานโดยการตัดความถี่ที่ไม่เกี่ยวกับเสียงพูดทิ้งทั้งหมด ทำให้มีพื้นที่เก็บข้อมูลในส่วนของเสียงพูดมาก รูปแบบนี้รองรับ sample rate แค่ 22,050 Hz เป็นเสียง mono อย่างเดียว แล้วก็ใช้ bit rate สูงสุดแค่ 20 kbps ครับ ไม่แนะนำให้ใช้กับงานอย่างอื่นนอกจะเสียงพูดครับ อุปกรณ์ที่รองรับก็ยังเป็นโทรศัพท์มือถือที่ใช้ Windows mobile เหมือนเดิมครับ คู่แข่งของ WMA voice ก็คือ speex รูปแบบบีบอัดเสียงพูดฟรีๆ จาก xiph.org ครับ

ซึ่งทั้งหมดนี้สามารถสร้างได้จาก Windows media player รุ่น 10 ขึ้นไปครับ

สรุปเจ้า WMA นะครับ ผมไม่แนะนำให้ใช้ WMA ครับ ใช้ mp3 ดีกว่า ยกเว้นว่าถ้าเครื่องของคุณรองรับ WMA pro ก็ใช้เป็น WMA pro ก็ได้ครับ ใช้ที่ bit rate ราวๆ 128 kbps หรือ 160 kbps ก็ให้เสียงโอเคแล้วครับ


เปรียบเทียบประสิทธิภาพของ lossy codec

มาถึงตรงนี้ผมได้แนะนำรูปแบบการบีบอัดเสียงแบบ lossy ไป 4 รูปแบบสำคัญๆ แล้วนะครับ เพื่อให้การตัดสินใจง่ายขึ้น ผมจะนำเอาผลการทดสอบจากเว็บต่างๆ มาให้ดูกันนะครับ เออ เวลาอ่านกราฟให้ดูสเกลด้วยนะครับ อย่าให้ระยะห่างของจุดมันหลอก เพราะบางที่กราฟจะถูกขยายให้เห็นชัดครับ แต่จริงๆ แล้วมันไม่ได้แตกต่างกันขนาดนั้น

ภาพแรกนี้เป็นการทดสอบคุณภาพเสียงที่ bit rate 48 kbps เมื่อเดือนพฤศจิกายน 2006 ครับ จะเห็นได้ว่า HE-AAC อยู่อันดับที่ 1 แล้ว aoTuV beta 5 กับ WMA pro 10 ตามมา ส่วน WMA 9.2 นั้นอยู่รั้งท้ายอย่างเทียบไม่ติดครับ แต่ bit rate แค่นี้ผมก็ไม่แนะนำให้ใช้ทั่วๆ ไปนะครับ ยกเว้นถ้ามีพื้นที่น้อยจริงๆ อ่านข้อมูลการทดสอบเต็มๆ กดที่รูปครับ



ต่อมาเป็นการทดสอบคุณภาพเสียงที่ bit rate 64 kbps เมื่อเดือนกรกฎาคม 2007 ครับ จะเห็นได้ว่า rating จะสูงกว่าเมื่อ 48 kbps นิดหน่อยนะครับ


การทดสอบที่ bit rate 96 kbps เมื่อเดือนสิงหาคมปี 2005 WMA ได้อันดับสุดท้ายเลย


ที่นี้ดูที่ 128 kbps ทดสอบเมื่อเดือนธันวาคม 2005 บ้างครับ จะเห็นว่าถ้าเอา mp3 (โดย LAME) ไปเทียบกับรูปแบบใหม่ๆ ประสิทธิภาพจะด้อยกว่าครับ แต่ไม่มากเท่าไหร่

ผมคงแนะนำเป็นตัวอย่างเท่านี้นะครับ ถ้าสนใจอ่านเพิ่มเติมก็ลองอ่านดูที่ http://www.soundexpert.info/index.htm และ http://en.wikipedia.org/wiki/Codec_listening_test ครับ แต่เวลาอ่านการทดสอบก็ต้องดูรุ่นของ Encoder ที่เข้าร่วมการทดสอบ รวมถึงวันที่ทดสอบด้วยนะครับ ว่าใกล้เคียงกับที่เรากำลังใช้อยู่รึปล่าว


สรุปส่วนของ Lossy
ถ้าใช้บนคอมพิวเตอร์อย่างเดียว แนะนำให้ rip เป็น Vorbis aoTuV beta 5.5 หรือ LC-AAC หรือ WMA pro แล้วแต่สะดวกครับ (แต่ผมชอบ Vorbis มากที่สุดนะครับ) เลือกให้เป็นแบบ VBR ส่วน bit rate ก็ใช้ตามที่แนะนำไปในแต่ล่ะรูปแบบไฟล์ครับ
ถ้าใช้บนเครื่องเล่นแบบพกพาด้วย ก็เลือกรูปแบบที่ดีกว่า mp3 เครื่องเล่นนั้นเล่นได้ เช่นถ้าเครื่องเล่น vorbis และ mp3 ได้ ก็แนะนำให้ใช้ vorbis ก่อนครับ หรืออย่าง iPod ก็แนะนำให้ rip เป็น AAC จะดีกว่า แต่ถ้าเครื่องนั้นเล่นได้เฉพาะ mp3 และ wma ธรรมดา (ไม่ใช่รุ่น pro) ก็แนะนำให้ rip เป็น mp3 จะดีกว่าเป็น wma ครับ ส่วน bit rate ก็ตามที่แนะนำในรูปแบบไฟล์ต่างๆ ครับ
แต่ถ้าต้องการไฟล์ที่แน่ใจว่าเล่นได้กับทุกเครื่อง ก็ต้องเป็น mp3 ครับ ปรับตามที่แนะนำนะครับ จะได้ mp3 ที่ดีที่สุด
แล้วถ้าอยากได้เสียงที่เฉียบขาด สมบูรณ์ที่สุด ก็ต้องนี้เลยครับ ไฟล์รูปแบบ Lossless ซึ่งผมจะแนะนำในบทความต่อไปครับ เพราะ Blogger มันไม่รับซะแล้ว

อย่าลืม comment นะครับ ไม่งั้นงอนไม่เอาบทความมาลงอีกจริงๆ ด้วย

ป้ายกำกับ:

07 มีนาคม 2551

สอบวิชาตัวสุดท้ายของชีวิต



ถ้าไม่มีอะไรผิดพลาด และผมไม่เรียนต่อ วิชาที่สอบวันนี้ (สุนทรียศาสตร์) จะเป็นการสอบตัวสุดท้ายของชีวิตการศึกษาที่ยาวนาน 20 กว่าปีแล้วครับ
มาถึงตรงนี้ก็คิดถึงอดีตเหมือนกันนะครับ เมื่อสี่ปีก่อนตอนที่ผมเข้ามาเรียนที่ธรรมศาสตร์ รังสิต ตอนนั้นยังเด็กๆ อยู่เลย ยังเล่นนู้นเล่นนี้ ทำกิจกรรมอะไรเยอะแยะมากมาย ได้รู้จักเพื่อนใหม่ๆ เต็มไปหมด แม้ว่าเราจะพูดไม่ค่อยเป็น

คิดถึงบรรยากาศเด็กๆ ที่รังสิต

ตอนนี้มาอยู่ท่าพระจันทร์ ด้วยงานที่มากขึ้น และบรรยากาศของคนที่กำลังจะจบ เลยไม่ค่อยได้เจอเพื่อนๆ เท่าไหร่ ต่างคนต่างแยกย้ายกันไปทำงาน ไปตามทางของตัวเอง ตัวเราเองก็ต้องหางานทำได้แล้ว เวลาที่ยังเป็นเด็ก ไม่ต้องทำงานอะไรมากมายกำลังจะจบลง

แล้วชีวิตก็กำลังจะเปลี่ยนแปลงไปอีกครั้ง

ขอบคุณทุกสิ่งที่ผ่านมาตลอดชีวิตการศึกษา ขอบคุณอาจารย์ทุกท่านที่คอยสอน ขอบคุณเพื่อนๆ ทุกๆ ตัวที่คอยป่วน และขอบคุณทุกแรงบันดาลใจที่ทำให้มีเราเป็นเราจนถึงทุกวันนี้
.......
....
..
.

ป้ายกำกับ: